首页用python写两个excel对比，标记不重复数据的代码

用python写两个excel对比，标记不重复数据的代码

时间: 2024-03-02 08:50:51 浏览: 199

好的，以下是一个简单的示例代码，用于对比两个 Excel 表格并标记不重复的数据： ```python import pandas as pd # 读取两个 Excel 文件 df1 = pd.read_excel('example1.xlsx') df2 = pd.read_excel('example2.xlsx') # 对比两个数据框 df_merge = pd.merge(df1, df2, how='outer', indicator=True) # 标记不重复的数据 df_merge.loc[df_merge['_merge'] == 'left_only', '标记列'] = '不重复' # 保存标记后的数据框 df_merge.to_excel('example_merged.xlsx', index=False) ``` 在这个代码中，我们首先使用 Pandas 库的 `read_excel` 函数读取需要对比的两个 Excel 文件，并将它们存储为两个 Pandas 数据框。然后，我们使用 `merge` 函数将这两个数据框按照指定的方式进行合并，同时使用 `indicator` 参数添加一列 `_merge` 标记数据是否在两个数据框中都存在。最后，我们使用 `loc` 方法将 `_merge` 列中值为 `left_only` 的行标记为不重复的数据，并在标记列中添加一个标记值。最后，我们使用 `to_excel` 函数将标记后的数据框保存为一个新的 Excel 文件。请注意，这个示例代码中的文件名、列名和标记值需要根据具体情况进行修改。另外，如果需要对比的列不止一列，需要在 `merge` 函数中指定多个列名。

阅读全文