首页pandas读取excel文件中内容不规则的数据

pandas读取excel文件中内容不规则的数据

时间: 2023-12-11 14:05:14 浏览: 76

Pandas可以通过read_excel()函数来读取Excel文件，并且可以通过参数设置来处理不规则的数据。假设有一个Excel文件，其中的数据如下： | Name | Age | Gender | Address | | ---- | --- | ------ | ------- | | John | 25 | Male | New York| | Jane | | Female | | | Tom | 30 | | Beijing | | Lily | | Female | Shanghai| 其中有些单元格中没有数据，这种情况在Pandas中默认会被当作缺失值NaN处理。如果需要将这些空值转换成其他值，可以使用参数na_values。例如，将空值转换成字符串'Unknown'： ``` import pandas as pd df = pd.read_excel('data.xlsx', na_values='', keep_default_na=False) df.fillna('Unknown', inplace=True) print(df) ``` 输出结果为： ``` Name Age Gender Address 0 John 25 Male New York 1 Jane Unknown Female Unknown 2 Tom 30 Unknown Beijing 3 Lily Unknown Female Shanghai ``` 另外，如果需要读取指定的单元格范围，可以使用参数usecols和skiprows。例如，只读取A1到D4范围内的数据并跳过前两行： ``` import pandas as pd df = pd.read_excel('data.xlsx', usecols='A:D', skiprows=2) print(df) ``` 输出结果为： ``` Tom 30 NaN Beijing 0 Lily NaN Female Shanghai ```

阅读全文