如何使用Python编程将多个文件夹中的Excel表格数据合并成一个单一的汇总表格?
时间: 2024-12-10 07:29:19 浏览: 32
在Python中,我们可以使用pandas库来方便地读取和合并多个Excel文件,然后将其保存到一个新的汇总表格中。以下是基本步骤:
1. 首先,需要安装必要的库,如果还没有安装,可以使用`pip install pandas openpyxl`(对于旧版本的Excel文件,可能还需要`pip install xlrd`)。
2. 导入所需的库:
```python
import os
import pandas as pd
```
3. 定义要合并的文件夹路径和输出的汇总表格名称:
```python
folder_path = 'your_folder_path' # 替换为实际文件夹路径
output_file = 'merged_data.xlsx'
```
4. 创建一个函数来读取单个文件并添加到总表:
```python
def read_excel_and_concatenate(file_path):
df = pd.read_excel(file_path)
return df
# 初始化一个空的数据框来存放所有数据
all_data = pd.DataFrame()
```
5. 遍历文件夹,读取每个Excel文件并追加到总数据框中:
```python
for filename in os.listdir(folder_path):
if filename.endswith('.xlsx'): # 只处理Excel文件
file_path = os.path.join(folder_path, filename)
single_df = read_excel_and_concatenate(file_path)
all_data = pd.concat([all_data, single_df], ignore_index=True) # ignore_index=True防止索引重复
```
6. 最后,将汇总数据写入新的Excel文件:
```python
all_data.to_excel(output_file, index=False)
```
阅读全文