Python对多个文件夹内的Excel表格进行合并,输出文件夹的名字作为表格数据
时间: 2024-09-12 08:11:24 浏览: 48
在Python中,我们可以使用`pandas`库来处理Excel文件,并结合`os`库来遍历文件夹。下面是一个简单的步骤说明:
首先,你需要安装`pandas`和`openpyxl`库,如果尚未安装,可以使用以下命令安装:
```bash
pip install pandas openpyxl
```
然后,你可以编写一个函数来遍历指定的文件夹,查找所有`.xlsx`或`.xls`文件,将它们读取到`pandas` DataFrame中,再进行合并:
```python
import os
import pandas as pd
def merge_excel_files(folder_path):
merged_df = None # 存放合并后的DataFrame
for root, dirs, files in os.walk(folder_path): # 遍历文件夹
for file in files:
if file.endswith(('.xlsx', '.xls')):
file_path = os.path.join(root, file)
df_temp = pd.read_excel(file_path) # 读取单个Excel文件
if merged_df is None: # 如果首次遍历,初始化
merged_df = df_temp
else:
merged_df = pd.concat([merged_df, df_temp], ignore_index=True) # 合并数据
return merged_df
# 调用函数,传入你要合并的文件夹路径
folder_to_merge = 'your_folder_path'
result_df = merge_excel_files(folder_to_merge)
# 输出结果,例如保存到新的Excel文件
output_file_name = 'merged_data.xlsx'
result_df.to_excel(output_file_name, index=False)
阅读全文