pd.read_csv 读取指定列
时间: 2023-11-11 07:57:06 浏览: 177
当使用pd.read_csv进行文件读取时,可以通过参数usecols来指定要读取的列。usecols可以接受一个列表作为参数,列表中的元素可以是列名或列的索引。例如,如果要读取文件中的第一列和第三列,可以使用以下代码:
```python
import pandas as pd
data = pd.read_csv("文件路径", usecols=[0, 2])
```
这将返回一个包含指定列的DataFrame对象。在这个例子中,第一列的索引是0,第三列的索引是2。
相关问题
pd.read_csv读取指定列写入另外文件
您可以使用 pandas 库中的 `read_csv` 函数读取指定列,并使用 `to_csv` 函数将数据写入另一个文件。下面是一个示例代码:
```python
import pandas as pd
# 读取 CSV 文件
df = pd.read_csv('input.csv')
# 选择需要的列
selected_columns = ['column1', 'column2', 'column3']
df_selected = df[selected_columns]
# 将数据写入另一个文件
df_selected.to_csv('output.csv', index=False)
```
在上面的示例中,您需要将 `'column1'`、`'column2'` 和 `'column3'` 替换为您需要选择的实际列名。`'input.csv'` 是要读取的原始文件名,`'output.csv'` 是要写入的目标文件名。
使用 `index=False` 参数可以避免将索引写入输出文件中。如果您希望保留索引,请将 `index=False` 删除或设置为 `index=True`。
请确保已经安装了 pandas 库,可以使用以下命令进行安装:
```
pip install pandas
```
pd.read_csv取出指定列
可以使用pd.read_csv()函数的usecols参数来取出指定列。usecols参数可以接受一个列表,列表中包含需要取出的列名或列号。例如,假设我们有一个名为data.csv的文件,其中包含三列数据,分别为A、B、C,我们想要取出B列和C列的数据,可以使用以下代码:
```python
import pandas as pd
# 读取文件,只取出B列和C列的数据
df = pd.read_csv('data.csv', usecols=['B', 'C'])
# 打印取出的数据
print(df)
```
如果我们想要取出第2列和第3列的数据,可以使用以下代码:
```python
import pandas as pd
# 读取文件,只取出第2列和第3列的数据
df = pd.read_csv('data.csv', usecols=[1, 2])
# 打印取出的数据
print(df)
```