两个dataframe 取差集
时间: 2024-08-14 11:06:15 浏览: 99
geopandas-0.1.1.tar.gz
在Python的数据处理库pandas中,如果你有两个DataFrame并且想要获取它们之间的差集,你可以使用`difference()`函数。这个操作会返回第一个DataFrame中不在第二个DataFrame中存在的所有行。以下是基本步骤:
```python
import pandas as pd
# 假设 df1 和 df2 是两个DataFrame
df1 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df2 = pd.DataFrame({'A': [2, 4], 'B': [5, 7]})
# 获取 df1 中除了 df2 所有元素的差集
diff_df = df1[~df1.isin(df2)]
print(diff_df)
```
这将输出 `df1` 中除了 `df2` 的共同元素外的所有行。注意这里我们使用了布尔索引来排除 `df2` 中存在的行。
阅读全文