pd.merge取并集
时间: 2024-02-24 22:52:14 浏览: 89
pd.merge()是pandas库中用于合并数据的函数之一,它可以根据指定的列或索引将两个或多个DataFrame对象进行合并。当我们使用pd.merge()函数时,可以通过指定参数how来控制合并的方式,其中包括取并集的方式。
具体来说,当我们将参数how设置为"outer"时,pd.merge()函数会将两个DataFrame对象的所有行进行合并,并且对于没有匹配的值,会用NaN填充。这样就实现了取并集的效果。
下面是一个示例代码,展示了如何使用pd.merge()函数进行取并集的操作:
```python
import pandas as pd
# 创建两个DataFrame对象
df1 = pd.DataFrame({'A': [1, 2, 3],
'B': ['a', 'b', 'c']})
df2 = pd.DataFrame({'A': [3, 4, 5],
'C': ['x', 'y', 'z']})
# 使用pd.merge()函数进行取并集
merged_df = pd.merge(df1, df2, how='outer')
print(merged_df)
```
运行以上代码,输出结果如下:
```
A B C
0 1 a NaN
1 2 b NaN
2 3 c x
3 4 NaN y
4 5 NaN z
```
可以看到,合并后的DataFrame对象包含了两个原始DataFrame对象的所有行,并且对于没有匹配的值,用NaN进行填充。
阅读全文