对一个文件夹下的csv数据批量提取几列然后形成新的csv文件
时间: 2024-03-20 10:44:13 浏览: 84
您可以使用Python中的pandas库来完成这个任务。以下是一个简单的代码示例:
```python
import pandas as pd
import os
# 设置文件夹路径和需要提取的列
folder_path = "your_folder_path"
columns_to_extract = ["column1", "column2", "column3"]
# 循环遍历文件夹中的所有csv文件并提取指定列
for file_name in os.listdir(folder_path):
if file_name.endswith(".csv"):
file_path = os.path.join(folder_path, file_name)
df = pd.read_csv(file_path)
df = df[columns_to_extract]
# 将提取的数据保存到新的csv文件中
new_file_name = "new_" + file_name
new_file_path = os.path.join(folder_path, new_file_name)
df.to_csv(new_file_path, index=False)
```
这段代码将遍历指定文件夹中的所有csv文件,依次读取每个文件并提取指定的列。然后,将提取的数据保存到新的csv文件中。注意,这段代码假设所有要处理的csv文件都位于同一个文件夹中,并且要提取的列名都是相同的。如果您需要处理更复杂的情况,请根据实际情况进行修改。
阅读全文