写一个python脚本,批量实现将一个文件夹内多个excel文件sheet1表单中的数据整合到一个表单中
时间: 2024-09-10 14:14:09 浏览: 43
Python项目-自动办公-48 Excel-xlutils设置格式.zip
要批量实现将一个文件夹内多个Excel文件(假设都是xlwt或openpyxl格式)的`sheet1`表单中的数据整合到一个新的Excel文件中,可以采用以下Python脚本:
首先,我们需要安装`openpyxl`库来读取Excel文件,因为它支持打开多种格式的文件。如果尚未安装,可以通过pip安装:
```shell
pip install openpyxl
```
然后,我们可以编写如下的脚本来执行这个任务:
```python
import os
import pandas as pd
# 定义源文件夹路径和目标文件路径
source_folder = "path_to_your_source_folder"
target_file = "merged_data.xlsx"
# 获取文件夹内所有Excel文件
files = [f for f in os.listdir(source_folder) if f.endswith('.xlsx') or f.endswith('.xls')]
# 初始化一个新的DataFrame用于合并数据
merged_df = pd.DataFrame()
# 循环遍历每个Excel文件
for file_name in files:
# 使用openpyxl读取数据
with pd.ExcelFile(os.path.join(source_folder, file_name), engine='openpyxl') as excel:
# 取得sheet1的数据
df_from_file = excel.parse('sheet1')
# 将数据添加到合并的DataFrame
merged_df = merged_df.append(df_from_file)
# 写入合并后的数据到目标文件
merged_df.to_excel(target_file, index=False)
print(f"所有Excel文件的'sheet1'数据已合并至'{target_file}'")
#
阅读全文