如何使用python对比2个文件夹中所有表格名称的差异，需要对比的文件夹会嵌套多个文件夹，帮我整理为完整代码

时间: 2024-12-18 13:17:17 浏览: 4

批量创建文件代码/批量创建文件夹程序/批量创建嵌套的文件夹

5星 · 资源好评率100%

在Python中，你可以使用`os`, `glob`, 和 `pandas`库来比较两个嵌套文件夹中的Excel表格（`.xlsx` 或 `.xls`）文件名。这里是一个基本的脚本示例，它会递归遍历文件夹并找出表单标题（假设为第一行数据的列标题）之间的差异： ```python import os import glob import pandas as pd # 定义两个要比较的文件夹路径 folder1 = 'path_to_folder1' folder2 = 'path_to_folder2' def compare_excel_files(folder1, folder2): # 获取第一个文件夹中的所有Excel文件 files1 = glob.glob(os.path.join(folder1, '**/*.xls*'), recursive=True) # 检查第二个文件夹是否为空，防止后续异常 if not files2 := glob.glob(os.path.join(folder2, '**/*.xls*'), recursive=True): print(f"Folder {folder2} is empty.") return # 创建一个字典存储每个文件的数据框 dfs = {} for file in files1: name = os.path.basename(file).split('.')[0] # 获取文件名，去掉扩展名 dfs[name] = pd.read_excel(file, header=0) # 使用pandas读取文件，假设第一行是表头 # 对比两个文件夹中的文件 diff_files = set(dfs.keys()) ^ set(files2) # 使用集合差集找出新加入或删除的文件 # 对于存在的文件，检查标题差异 for file_name in diff_files: df1 = dfs[file_name] df2_path = os.path.join(folder2, f'{file_name}.xlsx') # 假设文件名一样，只改文件夹 try: df2 = pd.read_excel(df2_path, header=0) # 比较两份文件的第一行（即标题） if not df1.columns.equals(df2.columns): # 如果列名不同 print(f"Different column headers in {file_name}:") print("df1:", df1.columns.tolist()) print("df2:", df2.columns.tolist()) except FileNotFoundError: print(f"{file_name} exists only in {folder1}") # 调用函数开始比较 compare_excel_files(folder1, folder2) ```

阅读全文

如何使用python对比2个文件夹中所有表格名称的差异，需要对比的文件夹会嵌套多个文件夹，帮我整理为完整代码

相关推荐

Python办公自动化：实现电脑文件和文件夹高效管理

Python+Socket实现文件夹高效传输教程

如何使用python对比2个文件夹中所有表格名称的差异并打印出来，需要对比的文件夹会嵌套多个文件夹，帮我整理为完整代码

如何使用python对比2个文件夹中所有表格名称的差异，需要对比的文件夹会嵌套多个文件夹

【配置管理对比】：深入比较Python中ConfigParser与其他配置库

Python单元测试之美：nose.tools与doctest对比分析的5大不同

【Python文件比较的终极武器】：filecmp与shutil的协同使用

Python开发插件：Atom编辑器插件推荐与使用技巧，提高编码效率

Kivy for Python：从安装到第一个应用的全面教程（一步到位）

【Python递归与树结构】：递归函数在树数据处理中的优势

【VSCode代码片段高效使用指南】：12个秘诀打造个性化代码片段

列表推导式终极指南：Python可变数据结构的高效操作

VSCode代码片段自定义：高级函数使用详解

自动化文档生成秘籍：Python-docx批量报告制作（实用型）

Python包组织架构揭秘：pkgutil视角下的模块、包、子包

【YAML异常处理秘籍】：Python开发者避免解析错误和数据丢失（附案例）

掌握VSCode多光标：代码编辑效率提升的终极秘诀

PyCharm与其他IDE对决：谁才是代码检查的王者？

【STDF文件完整性校验】：确保测试日志数据准确无误的黄金法则

最新推荐

python读取多层嵌套文件夹中的文件实例

Python实现合并同一个文件夹下所有txt文件的方法示例

python实现将两个文件夹合并至另一个文件夹(制作数据集)

python使用openCV遍历文件夹里所有视频文件并保存成图片

python按顺序重命名文件并分类转移到各个文件夹中的实现代码

PureMVC AS3在Flash中的实践与演示：HelloFlash案例分析

管理建模和仿真的文件

YRC1000 EtherNet_IP通信协议：掌握连接与数据交换的6个关键策略

如何设置 OpenFileDialog 用户只能在固定文件夹及其子文件夹里选择文件

掌握Makefile多目标编译与清理操作