python对比两个excel表内重复重复并标记
时间: 2023-09-16 19:06:32 浏览: 546
以下是使用pandas库在Python中对比两个excel表内重复并标记的示例代码:
```python
import pandas as pd
# 读取两个excel表
df1 = pd.read_excel('table1.xlsx')
df2 = pd.read_excel('table2.xlsx')
# 标记df1中与df2重复的行,添加'重复'列并赋值为True
df1['重复'] = df1.duplicated(subset=list(df1.columns)).map({True: '是', False: '否'})
# 标记df2中与df1重复的行,添加'重复'列并赋值为True
df2['重复'] = df2.duplicated(subset=list(df2.columns)).map({True: '是', False: '否'})
# 将两个表合并并按照第一列排序
merged_df = pd.concat([df1, df2], axis=0).sort_values(by=df1.columns[0])
# 根据第一列去除重复行,保留最后一个出现的行
merged_df.drop_duplicates(subset=df1.columns[0], keep='last', inplace=True)
# 保存结果到新的excel文件
merged_df.to_excel('result.xlsx', index=False)
```
在上述代码中,我们首先使用pandas库读取了两个excel表,并分别对每个表进行了重复标记。接着,我们将两个表合并,并按照第一列排序,然后根据第一列去除重复行,保留最后一个出现的行。最后,我们将结果保存到新的excel文件中。
阅读全文