pandas对比两张表数据差异
时间: 2023-07-12 14:31:45 浏览: 512
比较两表差异,并生成差异数据
你可以使用pandas中的merge()函数和compare()函数对比两张表的数据差异。
首先使用merge()函数将两张表合并为一张表,然后使用compare()函数对比两张表的数据差异。
下面是一个示例代码:
```
import pandas as pd
# 读取两张表
df1 = pd.read_csv('table1.csv')
df2 = pd.read_csv('table2.csv')
# 合并两张表
merged_df = pd.merge(df1, df2, how='outer', on='id')
# 对比两张表的数据差异
diff_df = merged_df.compare(df1, keep_equal=False)
print(diff_df)
```
在上面的代码中,我们首先使用read_csv()函数读取了两张表,然后使用merge()函数将这两张表合并为一张表。最后使用compare()函数对比了两张表的数据差异,并将结果打印出来。
需要注意的是,compare()函数只会比较两张表中的相同列,并且只会比较相同的行,如果两张表中存在不同列或不同行,这些数据差异将不会被比较。
阅读全文