python读取文件夹多个xlsx文件并对每个文件的列数据进行处理后将处理后的数据自定义列名另存保存
时间: 2023-10-21 19:03:59 浏览: 97
Python读取xlsx文件的实现方法
以下是一个示例代码,读取文件夹内所有的xlsx文件,对每个文件的第一列进行平方操作,并将处理后的数据保存到新的文件中。
```python
import os
import pandas as pd
# 定义文件夹路径和新文件保存路径
folder_path = 'path/to/folder'
save_path = 'path/to/save/newfile.xlsx'
# 定义自定义列名
column_name = 'new_column_name'
# 获取文件夹内所有xlsx文件的文件名
file_names = [f for f in os.listdir(folder_path) if f.endswith('.xlsx')]
# 遍历每个文件,读取数据进行处理
for file_name in file_names:
# 读取文件数据
file_path = os.path.join(folder_path, file_name)
data = pd.read_excel(file_path)
# 对第一列进行平方操作
data[column_name] = data.iloc[:, 0] ** 2
# 保存处理后的数据到新文件
with pd.ExcelWriter(save_path, mode='a') as writer:
data.to_excel(writer, sheet_name=file_name, index=False)
```
上述代码中,使用了pandas库来读取和处理数据,os库来获取文件名和拼接路径。代码中定义了文件夹路径和新文件保存路径,自定义列名以及获取文件名的方式。对于每个文件,先读取数据,对第一列进行平方操作,再将处理后的数据保存到新文件中。注意,保存数据时需要使用`ExcelWriter`对象,并指定保存的sheet名和不包含索引列。
阅读全文