使用PYTHON把指定文件夹里面所有的xls文件里指定的字段,合并在一个excel里面
时间: 2024-03-13 20:46:56 浏览: 72
Python合并多个子文件夹下相同名字的excel文件
5星 · 资源好评率100%
您可以使用Python的pandas库来将指定文件夹中的所有Excel文件的指定字段合并到一个DataFrame中,然后将其保存到一个新的Excel文件中。以下是示例代码:
```python
import os
import pandas as pd
# 指定要合并的Excel文件所在的文件夹路径
folder_path = 'path/to/folder'
# 获取文件夹中所有xls文件的文件名
xls_files = [f for f in os.listdir(folder_path) if f.endswith('.xls')]
# 指定要合并的字段
columns_to_merge = ['column1', 'column2', 'column3']
# 读取所有Excel文件并合并到一个DataFrame中
merged_df = pd.DataFrame()
for xls_file in xls_files:
xls_path = os.path.join(folder_path, xls_file)
sheet_name = pd.read_excel(xls_path, sheet_name=None)
for name, sheet in sheet_name.items():
sheet['file_name'] = os.path.splitext(xls_file)[0]
sheet['sheet_name'] = name
merged_df = pd.concat([merged_df, sheet[columns_to_merge]], ignore_index=True)
# 将合并后的DataFrame保存到新的Excel文件中
merged_df.to_excel('merged_excel.xlsx', index=False)
```
请将 `path/to/folder` 替换为您要合并的Excel文件所在的文件夹的实际路径。此代码将只合并扩展名为 `xls` 的文件。如果您要合并多个文件类型,只需在列表推导式中添加其他文件类型的条件即可。
此代码将读取每个Excel文件中的所有工作表,并仅复制指定的字段到合并后的DataFrame中。最后,将合并后的DataFrame保存到一个新的Excel文件中。
阅读全文