python取出一个文件夹下所有excel文件中sheet_name=“结论认同表”的内容，并合并到一个新excel中进行输出

时间: 2024-03-25 10:41:39 浏览: 98

使用python将多个excel文件合并到同一个文件的方法

5星 · 资源好评率100%

### 使用Python将多个Excel文件合并到同一个文件的方法在日常工作中，经常需要处理大量的Excel文件。特别是当数据分散在多个Excel文件中时，手动合并这些文件不仅耗时且容易出错。利用Python的强大功能，我们可以轻松地自动化这一过程。本文将详细介绍如何使用Python将多个Excel文件合并到同一个文件中，并通过示例代码进行详细说明。 #### 应用场景本方法适用于需要将多个具有相同结构的Excel文件合并成一个文件的情况。例如，在数据分析项目中，可能会从不同来源获得多个Excel文件，每个文件都包含类似的数据结构（如相同的列名和数据类型）。为了便于进一步的数据分析和处理，可以将这些文件合并起来。 #### 准备工作在开始之前，请确保已经安装了Python环境以及必要的库。这里我们将使用`pandas`库来进行数据处理，如果还未安装该库，可以通过以下命令进行安装： ```bash pip install pandas openpyxl ``` #### 代码实现步骤 1. **导入所需模块**： ```python import os import pandas as pd ``` 2. **设置工作目录**： - 首先定义一个变量`pwd`来指定需要读取Excel文件的目录路径。 - 这里假设所有需要合并的Excel文件都在同一目录下。 3. **遍历目录中的文件**： - 使用`os.walk()`函数遍历指定目录及其子目录中的所有文件和文件夹。 - `os.walk()`返回一个三元组`(root, dirs, files)`，分别表示当前路径、该路径下的所有子目录名称列表和该路径下的所有非目录文件名称列表。 4. **读取并存储每个Excel文件**： - 创建一个空列表`dfs`用于存放各个Excel文件读取后形成的DataFrame对象。 - 对于找到的每一个Excel文件，使用`pd.read_excel()`函数将其内容读取到一个DataFrame对象中，并添加到`dfs`列表中。 5. **合并所有DataFrame**： - 使用`pd.concat()`函数将所有存储在`dfs`列表中的DataFrame合并成一个新的DataFrame。 6. **保存合并后的结果到新的Excel文件**： - 使用`to_excel()`方法将合并后的DataFrame保存到一个新的Excel文件中，这里设置`index=False`是为了避免保存索引数据。 #### 完整代码示例下面是完整的Python脚本，用于实现上述步骤： ```python import os import pandas as pd # 设置工作目录 pwd = 'test' # 假设所有的Excel文件都在这个目录下 # 新建列表存放每个文件数据 dfs = [] # 遍历目录中的文件 for root, dirs, files in os.walk(pwd): for file in files: if file.endswith('.xls') or file.endswith('.xlsx'): # 确保只处理Excel文件 file_path = os.path.join(root, file) df = pd.read_excel(file_path) # 将Excel转换成DataFrame dfs.append(df) # 将多个DataFrame合并为一个 df = pd.concat(dfs) # 写入新的Excel文件，不包含索引数据 df.to_excel('test\\result.xls', index=False) ``` #### 注意事项 - 在实际应用中，可能需要根据具体的文件路径和文件名格式调整代码。 - 如果Excel文件的编码格式不是默认的，则需要在`read_excel()`函数中指定正确的编码格式。 - 本示例假设所有Excel文件具有相同的列名和数据结构。如果列名或结构不同，则需要额外处理以确保数据的正确性。 #### 结论通过上述步骤，我们可以高效地使用Python将多个Excel文件合并成一个文件。这种方法不仅可以提高工作效率，还可以减少因手动操作而产生的错误。希望本文能对您的学习和工作有所帮助！

可以使用Python中的pandas和os模块来实现这个功能。具体的步骤如下： 1. 导入需要的模块： ```python import pandas as pd import os ``` 2. 设置需要读取的文件夹路径、目标sheet_name和输出文件名： ```python folder_path = 'your/folder/path' # 文件夹路径 target_sheet_name = '结论认同表' # 目标sheet名称 output_file_name = 'output.xlsx' # 输出文件名 ``` 3. 定义一个函数，用于读取一个excel文件中的目标sheet内容： ```python def read_excel_file(file_path): # 读取excel文件 xl = pd.ExcelFile(file_path) # 获取所有sheet名称 sheet_names = xl.sheet_names # 判断目标sheet是否在sheet名称列表中 if target_sheet_name in sheet_names: # 读取目标sheet内容 df = pd.read_excel(file_path, sheet_name=target_sheet_name) return df else: return None ``` 4. 遍历文件夹中的所有excel文件，并读取其中的目标sheet内容： ```python dfs = [] # 存储读取到的目标sheet内容 for file_name in os.listdir(folder_path): # 判断文件是否是excel文件 if file_name.endswith('.xlsx') or file_name.endswith('.xls'): file_path = os.path.join(folder_path, file_name) df = read_excel_file(file_path) if df is not None: dfs.append(df) ``` 5. 将所有读取到的目标sheet内容合并到一个新的DataFrame中，并输出到新的excel文件中： ```python # 合并所有数据 merged_df = pd.concat(dfs) # 输出到新的excel文件中 merged_df.to_excel(output_file_name, index=False) ``` 完整代码如下： ```python import pandas as pd import os folder_path = 'your/folder/path' # 文件夹路径 target_sheet_name = '结论认同表' # 目标sheet名称 output_file_name = 'output.xlsx' # 输出文件名 def read_excel_file(file_path): # 读取excel文件 xl = pd.ExcelFile(file_path) # 获取所有sheet名称 sheet_names = xl.sheet_names # 判断目标sheet是否在sheet名称列表中 if target_sheet_name in sheet_names: # 读取目标sheet内容 df = pd.read_excel(file_path, sheet_name=target_sheet_name) return df else: return None dfs = [] # 存储读取到的目标sheet内容 for file_name in os.listdir(folder_path): # 判断文件是否是excel文件 if file_name.endswith('.xlsx') or file_name.endswith('.xls'): file_path = os.path.join(folder_path, file_name) df = read_excel_file(file_path) if df is not None: dfs.append(df) # 合并所有数据 merged_df = pd.concat(dfs) # 输出到新的excel文件中 merged_df.to_excel(output_file_name, index=False) ``` 注意事项： 1. 确保所有excel文件中都存在目标sheet_name，否则会出现合并后的DataFrame中缺少一些列的情况； 2. 确保所有excel文件中的目标sheet格式相同，否则可能会出现合并后的DataFrame中格式不一致的情况。

阅读全文

python取出一个文件夹下所有excel文件中sheet_name=“结论认同表”的内容，并合并到一个新excel中进行输出

相关推荐

python对多个Excel文件中的多个Sheet进行合并（每个sheet名须一致）

python 将目录中所有excel合并到一个excel中 openpyxl 复制sheet工作表到另一个工作簿

对选择文件夹里的所有excel加密_加密_加密所有文件_对选择文件夹里的所有excel加密_文件加密_

python实现读取一个文件夹下所有文件的文件名，保存到excel中

python实现读取文件夹下所有excel文件内容上传MySQL数据库，并附带生成log文件，同时上传成功之后清空文件夹

Python合并同一个文件夹下所有PDF文件的方法

compare_excel_excelpython_pythonexcel_python_excel_

循环打开excel 并平均.zip_excel_循环 文件夹_打开文件夹下所有excel并进行平均

Python实现合并同一个文件夹下所有PDF文件的方法示例

Python实现合并同一个文件夹下所有txt文件的方法示例

Python项目-自动办公-51 Excel_案例_把文件夹整理到Excel中.zip

Python实验报告_pythonexcel_python3_excelpython_python教程_python_

python统计指定路径下的所有文件和文件夹并输出到excel表格中

python 自动办公- Excel_案例_把文件夹整理到Excel中.zip

Python自动办公-51 Excel_案例_把文件夹整理到Excel中.zip

将文件夹中的多个 Excel文件的数据并横向合并到一个新的Excel中

Python实现子文件夹下同名Excel合并工具

python 实现读取一个excel多个sheet表并合并的方法

最新推荐

Python实现合并同一个文件夹下所有txt文件的方法示例

使用 Python 合并多个格式一致的 Excel 文件(推荐)

Python实现调用另一个路径下py文件中的函数方法总结

python如何将两个txt文件内容合并

python实现将两个文件夹合并至另一个文件夹(制作数据集)

JavaScript实现的高效pomodoro时钟教程

管理建模和仿真的文件

【WebLogic客户端兼容性提升秘籍】：一站式解决方案与实战案例

使用jupyter读取文件“近5年考试人数.csv”，绘制近5年高考及考研人数发展趋势图，数据如下（单位：万人）。

CMake 3.25.3版本发布：程序员必备构建工具

循环打开excel 并平均.zip_excel_循环文件夹_打开文件夹下所有excel并进行平均