pandas中,一个数据帧包含另一个数据帧,剔除两个数据帧重复部分的方法
时间: 2024-05-11 22:15:40 浏览: 83
Python-一个封装了pandas和openpyxl的库允许在excel中对数据帧进行轻松样式化
可以使用 pandas 的 merge() 函数来合并两个数据帧,同时指定去除重复的列。具体实现可以参考以下代码:
```python
import pandas as pd
# 创建两个数据帧
df1 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df2 = pd.DataFrame({'A': [2, 3, 4], 'B': [5, 6, 7]})
# 合并两个数据帧,去除重复部分
result = pd.merge(df1, df2, on=['A', 'B'], how='outer', indicator=True)
result = result[result['_merge'] == 'left_only']
# 输出结果
print(result)
```
运行结果如下:
```
A B _merge
0 1 4 left_only
```
当然,这只是一个简单的示例,实际上根据你的具体需求,可能需要调整 merge() 函数的参数,以达到更好的去重效果。
阅读全文