python 读取某个文件夹里面所有的xlsx文件,并且合并为一个xlsx文件
时间: 2024-09-11 08:09:50 浏览: 50
python 读取文件夹下的子文件 xlsx,csv
要使用Python读取某个文件夹内所有的`.xlsx`文件,并将它们合并到一个新的`.xlsx`文件中,你可以使用`pandas`库来完成这个任务。以下是具体的操作步骤:
1. 首先,需要安装`pandas`和`openpyxl`库(如果尚未安装),因为`pandas`使用`openpyxl`来处理`.xlsx`文件。
```bash
pip install pandas openpyxl
```
2. 接下来,使用`pandas`读取指定文件夹内的所有`.xlsx`文件,并将它们合并。以下是一个示例代码:
```python
import pandas as pd
import os
# 指定包含xlsx文件的文件夹路径
folder_path = 'path_to_your_folder'
# 获取文件夹内所有的xlsx文件名
xlsx_files = [f for f in os.listdir(folder_path) if f.endswith('.xlsx')]
# 创建一个空的DataFrame用于存储所有文件的数据
all_data = pd.DataFrame()
# 遍历文件名列表,逐个读取并合并数据
for file in xlsx_files:
file_path = os.path.join(folder_path, file)
# 使用pandas读取xlsx文件
data = pd.read_excel(file_path)
# 将读取的数据追加到all_data DataFrame中
all_data = all_data.append(data, ignore_index=True)
# 将合并后的数据保存到新的xlsx文件中
output_file = 'combined.xlsx'
all_data.to_excel(output_file, index=False)
print(f'所有文件已合并到"{output_file}"')
```
请将`path_to_your_folder`替换为你的文件夹路径,这段代码会将该文件夹内所有的`.xlsx`文件合并到一个名为`combined.xlsx`的新文件中。
阅读全文