pd.read_excel参数,举例说明
时间: 2023-10-29 07:10:26 浏览: 107
`pd.read_excel()` 是 Pandas 库中读取 Excel 文件的函数,常用参数如下:
- `io`:读取的 Excel 文件名或者文件路径。
- `sheet_name`:读取的 sheet 名称或者 sheet 序号,默认为 0。
- `header`:指定列名所在行数,默认为 0,即第一行。
- `index_col`:指定索引列的列号或者列名,默认为 None,不指定索引列。
- `usecols`:指定读取的列号或者列名,可以是一个列表或者字符串。
- `dtype`:指定读取的数据类型,可以是一个字典,键为列名,值为数据类型。
- `skiprows`:指定需要跳过的行数,可以是一个整数或者列表。
- `nrows`:指定读取的行数。
- `skipfooter`:指定需要跳过的底部行数。
- `na_values`:指定需要被识别为 NaN 的值。
- `keep_default_na`:指定是否保留默认的 NaN 值。
- `converters`:指定自定义转换函数,可以是一个字典,键为列名,值为函数。
举例说明:
```python
import pandas as pd
# 读取 excel 文件
df = pd.read_excel('data.xlsx', sheet_name='Sheet1', header=0, index_col=None, usecols='A:C', dtype={'A': str, 'B': float, 'C': str}, skiprows=[0, 1], nrows=10, skipfooter=0, na_values=['NA'], keep_default_na=True, converters={'B': lambda x: x * 1000})
# 输出读取的数据
print(df)
```
以上代码会读取名为 `data.xlsx` 的 Excel 文件中的 `Sheet1` sheet,从第 2 行开始读取,读取前 10 行,跳过底部行,将第 1 列解析为字符串类型,第 2 列解析为浮点数类型并乘以 1000,第 3 列解析为字符串类型,将 `NA` 视为 NaN 值。最后将读取的数据输出到控制台。
阅读全文