pd.read_csv 读取指定列
时间: 2023-11-11 21:57:06 浏览: 308
当使用pd.read_csv进行文件读取时,可以通过参数usecols来指定要读取的列。usecols可以接受一个列表作为参数,列表中的元素可以是列名或列的索引。例如,如果要读取文件中的第一列和第三列,可以使用以下代码:
```python
import pandas as pd
data = pd.read_csv("文件路径", usecols=[0, 2])
```
这将返回一个包含指定列的DataFrame对象。在这个例子中,第一列的索引是0,第三列的索引是2。
相关问题
pd.read_csv读取指定列写入另外文件
您可以使用 pandas 库中的 `read_csv` 函数读取指定列,并使用 `to_csv` 函数将数据写入另一个文件。下面是一个示例代码:
```python
import pandas as pd
# 读取 CSV 文件
df = pd.read_csv('input.csv')
# 选择需要的列
selected_columns = ['column1', 'column2', 'column3']
df_selected = df[selected_columns]
# 将数据写入另一个文件
df_selected.to_csv('output.csv', index=False)
```
在上面的示例中,您需要将 `'column1'`、`'column2'` 和 `'column3'` 替换为您需要选择的实际列名。`'input.csv'` 是要读取的原始文件名,`'output.csv'` 是要写入的目标文件名。
使用 `index=False` 参数可以避免将索引写入输出文件中。如果您希望保留索引,请将 `index=False` 删除或设置为 `index=True`。
请确保已经安装了 pandas 库,可以使用以下命令进行安装:
```
pip install pandas
```
pd.read_csv怎么指定读取哪一列
可以使用`usecols`参数来指定读取哪些列,例如:
```python
import pandas as pd
# 读取csv文件,只读取第2列和第3列
df = pd.read_csv('data.csv', usecols=[1, 2])
# 打印读取的数据
print(df)
```
这样就只会读取csv文件中的第2列和第3列,并且生成一个包含这两列的DataFrame。
阅读全文