python如何用pandas读取一个文件夹里面的所有csv文件的第2列,忽略表头,保存为只有一列数据的数组,
时间: 2024-03-23 07:44:03 浏览: 63
使用pandas读取csv文件的指定列方法
可以按照以下步骤来实现:
1. 首先,使用Python的os模块,获取指定文件夹下所有csv文件的文件名列表。
```
import os
path = '/path/to/folder' # 指定文件夹路径
csv_files = [f for f in os.listdir(path) if f.endswith('.csv')] # 获取所有csv文件名
```
2. 接下来,使用pandas的read_csv函数读取每个csv文件,并将第2列数据保存到一个数组中。
```
import pandas as pd
data = [] # 用于保存所有第2列数据的数组
for file in csv_files:
df = pd.read_csv(os.path.join(path, file), header=None) # 读取csv文件,忽略表头
data.append(df.iloc[:, 1]) # 保存第2列数据到数组中
```
3. 然后,将data数组合并成一个只有一列数据的DataFrame。
```
result = pd.concat(data, axis=1) # 合并成一个DataFrame
result.columns = [f"feature_{i}" for i in range(1, len(csv_files) + 1)] # 给每一列设置特征名称
```
这样,就完成了读取指定文件夹下所有csv文件的第2列数据(忽略表头),并将其保存为只有一列数据的数组的操作。
阅读全文