分享pd.read_excel的常用方法
时间: 2024-04-16 10:22:25 浏览: 99
当使用Python中的pandas库读取Excel文件时,可以使用pd.read_excel()函数。以下是一些常用的方法和参数:
1. 读取Excel文件:
```
df = pd.read_excel('file.xlsx')
```
这将读取名为'file.xlsx'的Excel文件,并将其存储在DataFrame对象df中。
2. 指定工作表:
```
df = pd.read_excel('file.xlsx', sheet_name='Sheet1')
```
使用sheet_name参数可以指定要读取的工作表。默认情况下,它将读取第一个工作表。
3. 指定列范围:
```
df = pd.read_excel('file.xlsx', usecols='A:C')
```
使用usecols参数可以指定要读取的列范围。可以使用列标签(如'A', 'B', 'C')或列索引(如0, 1, 2)来指定。
4. 跳过行:
```
df = pd.read_excel('file.xlsx', skiprows=2)
```
使用skiprows参数可以跳过指定数量的行。在上面的示例中,将跳过前两行。
5. 指定索引列:
```
df = pd.read_excel('file.xlsx', index_col='ID')
```
使用index_col参数可以指定要用作索引的列。在上面的示例中,'ID'列将作为索引列。
6. 处理缺失值:
```
df = pd.read_excel('file.xlsx', na_values=['NA', 'N/A'])
```
使用na_values参数可以指定要识别为缺失值的特定值。在上面的示例中,'NA'和'N/A'将被视为缺失值。
阅读全文