请编写一段从某一个指定路径下的多个csv文件中提取特定列并将他们放入一个新的路径下的新的csv文件中的代码
时间: 2024-01-21 09:17:07 浏览: 139
以下是一个使用Python pandas库的示例代码,可以从指定路径下的多个csv文件中提取特定列并将它们放入新的路径下的新的csv文件中。
```python
import os
import pandas as pd
# 指定原始csv文件路径和特定列名
original_path = 'path/to/original/csv/files'
column_name = 'desired_column'
# 指定新的csv文件路径和文件名
new_path = 'path/to/new/csv/file'
new_file_name = 'new_file.csv'
# 获取原始csv文件列表
file_list = os.listdir(original_path)
# 创建一个空的DataFrame,用于存储提取的数据
data = pd.DataFrame()
# 循环遍历每个csv文件,并提取特定列
for file in file_list:
if file.endswith('.csv'):
file_path = os.path.join(original_path, file)
df = pd.read_csv(file_path, usecols=[column_name])
data = pd.concat([data, df])
# 将提取的数据保存到新的csv文件中
if not os.path.exists(new_path):
os.makedirs(new_path)
new_file_path = os.path.join(new_path, new_file_name)
data.to_csv(new_file_path, index=False)
```
该代码将从`original_path`路径下的所有csv文件中提取名为`column_name`的列,并将提取的数据保存到新的路径`new_path`下的`new_file.csv`文件中。注意,此代码假定每个csv文件都具有相同的列名并且该列是需要提取的列。如果需要提取不同的列或者列名不同,可以进行相应的修改。
阅读全文