首页快速对比两个excel 文件，A文件1，2，3列，B文件4，5，6列做对比，生成相同数据合差异数据结果

快速对比两个excel 文件，A文件1，2，3列，B文件4，5，6列做对比，生成相同数据合差异数据结果

时间: 2024-04-13 08:29:24 浏览: 99

要快速对比两个Excel文件，并生成相同数据和差异数据的结果，可以使用Python中的pandas库来处理Excel文件。下面是一个示例代码： ```python import pandas as pd # 读取Excel文件A和B df_a = pd.read_excel('file_a.xlsx') df_b = pd.read_excel('file_b.xlsx') # 按照1、2、3列进行合并 df_merged = pd.merge(df_a, df_b, on=['col1', 'col2', 'col3'], how='outer', suffixes=('_a', '_b')) # 获取相同数据（inner join） df_same = df_merged.dropna() # 获取差异数据（left join） df_diff = df_merged[df_merged.isnull().any(axis=1)] # 保存相同数据和差异数据到新的Excel文件 with pd.ExcelWriter('result.xlsx') as writer: df_same.to_excel(writer, sheet_name='Same Data', index=False) df_diff.to_excel(writer, sheet_name='Different Data', index=False) ``` 在上述代码中，假设文件A和文件B的列分别为col1、col2、col3和col4、col5、col6。首先使用`pd.read_excel`函数读取两个Excel文件，然后使用`pd.merge`函数按照1、2、3列进行合并，使用`how='outer'`表示使用外连接。接下来，通过`dropna()`函数获取相同数据，即删除存在空值的行；通过`isnull().any(axis=1)`获取差异数据，即至少有一个空值的行。最后，使用`pd.ExcelWriter`和`to_excel`函数将相同数据和差异数据保存到新的Excel文件中。请注意，你需要根据实际的Excel文件列名进行相应的修改，并确保安装了pandas库。

阅读全文