找出python pd.dataframe对比两个文件的差异 使用多种方法
时间: 2024-01-02 21:03:05 浏览: 65
除了上面提到的方法,Pandas库还提供了其他一些方法来对比两个Dataframe的差异,下面分别介绍:
1. 使用compare方法:该方法可以比较两个Dataframe的每个元素并返回一个新的Dataframe,其中每个元素的值为True或False,表示两个Dataframe对应位置的元素是否相等。示例代码如下:
```python
import pandas as pd
# 读取两个文件
df1 = pd.read_csv('file1.csv')
df2 = pd.read_csv('file2.csv')
# 比较两个Dataframe
diff = df1.compare(df2)
# 输出差异结果
print(diff)
```
2. 使用isin方法:该方法可以在一个Dataframe中查找另一个Dataframe中是否存在相同的记录,返回一个布尔型的Series对象。示例代码如下:
```python
import pandas as pd
# 读取两个文件
df1 = pd.read_csv('file1.csv')
df2 = pd.read_csv('file2.csv')
# 比较两个Dataframe
diff1 = df1[~df1.isin(df2)].dropna()
diff2 = df2[~df2.isin(df1)].dropna()
# 输出差异结果
print(diff1)
print(diff2)
```
在这个代码中,我们使用了两次isin方法,分别在df1和df2中查找另一个Dataframe中是否存在相同的记录,然后通过取反(~)和dropna方法,得到两个Dataframe中不同的记录。