skiprows
时间: 2023-07-25 13:21:31 浏览: 123
在 Pandas 中,`skiprows` 是 `read_csv()` 方法的一个参数,用于指定读取 CSV 文件时要跳过的行数。该参数可以接受一个整数、一个列表或一个函数作为参数。
以下是一些示例,演示如何使用 `skiprows` 参数:
1. 跳过前几行
```
import pandas as pd
# 从 CSV 文件中读取数据,跳过前两行
df = pd.read_csv('data.csv', skiprows=2)
```
在上面的代码中,`skiprows` 参数设置为 `2`,表示跳过 CSV 文件的前两行。
2. 跳过指定的行
```
# 从 CSV 文件中读取数据,跳过第 1、3、5 行
df = pd.read_csv('data.csv', skiprows=[0, 2, 4])
```
在上面的代码中,`skiprows` 参数设置为一个列表,其中包含要跳过的行的索引。
3. 跳过满足条件的行
```
# 从 CSV 文件中读取数据,跳过 age 列值为 25 的行
df = pd.read_csv('data.csv', skiprows=lambda x: x > 0 and x < 4 and int(x[3]) == 25)
```
在上面的代码中,`skiprows` 参数设置为一个函数,该函数接受一个整数参数,表示当前正在读取的行的索引。函数返回 `True` 表示跳过该行,返回 `False` 表示保留该行。在上面的示例中,函数使用了索引和 age 列的值来判断是否要跳过该行。
需要注意的是,如果 CSV 文件中的列名位于前几行,则应该使用 `header` 参数来指定列名所在行的索引,否则 `skiprows` 参数可能会导致列名被跳过。
阅读全文