pd.read_csv能抽样取数据吗
时间: 2023-07-06 09:06:35 浏览: 144
CSV文件数据抽取
是的,pandas库中的`pd.read_csv()`函数可以抽样取数据。你可以使用`pd.read_csv()`函数的`nrows`参数指定要读取的行数,或者使用`pd.read_csv()`函数的`skiprows`和`nrows`参数结合使用,跳过一些行并读取指定行数的数据。例如,下面的代码会随机抽取CSV文件中的50%的数据:
```
import pandas as pd
df = pd.read_csv('data.csv', header=0, skiprows=lambda i: i>0 and random.random() > 0.5)
```
其中,`header=0`表示第一行是数据的列名,`skiprows`参数使用了一个lambda函数,该函数跳过第一行(即列名行),并且当随机生成的数大于0.5时跳过该行。这样,`pd.read_csv()`函数只会读取随机选中的50%的数据。
阅读全文