批量读取一个文件夹下的csv文件提取列合成一个新的数据结构
时间: 2024-03-19 21:44:17 浏览: 45
好的,可以使用Python的pandas库来实现。具体步骤如下:
1. 导入pandas库
```python
import pandas as pd
```
2. 定义一个空的DataFrame
```python
df = pd.DataFrame()
```
3. 使用os库来遍历文件夹中的文件,将每个文件的内容读入DataFrame中
```python
import os
folder_path = 'your_folder_path' # 文件夹路径
for filename in os.listdir(folder_path):
if filename.endswith('.csv'): # 只读取csv文件
file_path = os.path.join(folder_path, filename)
temp_df = pd.read_csv(file_path, usecols=['col_name']) # 读取指定列
df = pd.concat([df, temp_df], axis=1) # 将每个文件的列合并到df中
```
其中,usecols参数可以指定要读取的列名或列序号,可以根据实际情况进行修改。
4. 查看合并后的DataFrame
```python
print(df.head())
```
这样就可以将一个文件夹下的csv文件中指定列合并成一个新的DataFrame了。
阅读全文