python读取文件夹多个xlsx文件并对每个文件的列数据进行处理后将处理后的数据另存一列保存
时间: 2023-10-21 17:04:01 浏览: 95
以下是一个示例代码,可以读取文件夹中的多个xlsx文件,对每个文件的列数据进行处理,并将处理后的数据另存为一列保存。
```python
import os
import pandas as pd
# 设置文件夹路径
folder_path = 'your_folder_path'
# 获取文件夹中所有xlsx文件的文件名
file_names = [name for name in os.listdir(folder_path) if name.endswith('.xlsx')]
# 循环读取每个文件,并进行处理
for file_name in file_names:
# 读取文件
file_path = os.path.join(folder_path, file_name)
df = pd.read_excel(file_path)
# 进行列数据处理
new_col = df['col1'] + df['col2'] # 以列1和列2相加作为示例处理方式
# 将处理后的数据添加为新列
df['new_col'] = new_col
# 另存为新文件
new_file_name = file_name[:-5] + '_new.xlsx' # 在原文件名后加上'_new'作为新文件名
new_file_path = os.path.join(folder_path, new_file_name)
df.to_excel(new_file_path, index=False)
```
这个代码中,我们首先设置了文件夹路径,然后获取了该文件夹中所有xlsx文件的文件名。接下来,我们循环读取每个文件,并对其列数据进行处理。在这个示例中,我们以列1和列2相加作为处理方式。然后,我们将处理后的数据添加为新列,并将数据另存为新文件。在这个示例中,我们在原文件名后加上'_new'作为新文件名。最终,我们得到了一个新文件夹,其中包含了所有原文件的处理后的版本。
阅读全文