pandas读取excel文件中内容不规则的数据
时间: 2023-12-11 19:05:14 浏览: 66
Pandas可以通过read_excel()函数来读取Excel文件,并且可以通过参数设置来处理不规则的数据。
假设有一个Excel文件,其中的数据如下:
| Name | Age | Gender | Address |
| ---- | --- | ------ | ------- |
| John | 25 | Male | New York|
| Jane | | Female | |
| Tom | 30 | | Beijing |
| Lily | | Female | Shanghai|
其中有些单元格中没有数据,这种情况在Pandas中默认会被当作缺失值NaN处理。如果需要将这些空值转换成其他值,可以使用参数na_values。例如,将空值转换成字符串'Unknown':
```
import pandas as pd
df = pd.read_excel('data.xlsx', na_values='', keep_default_na=False)
df.fillna('Unknown', inplace=True)
print(df)
```
输出结果为:
```
Name Age Gender Address
0 John 25 Male New York
1 Jane Unknown Female Unknown
2 Tom 30 Unknown Beijing
3 Lily Unknown Female Shanghai
```
另外,如果需要读取指定的单元格范围,可以使用参数usecols和skiprows。例如,只读取A1到D4范围内的数据并跳过前两行:
```
import pandas as pd
df = pd.read_excel('data.xlsx', usecols='A:D', skiprows=2)
print(df)
```
输出结果为:
```
Tom 30 NaN Beijing
0 Lily NaN Female Shanghai
```
阅读全文