pd.merge函数
时间: 2023-09-04 09:17:01 浏览: 101
pd.merge函数是Pandas库中的一个函数,用于将两个或多个DataFrame对象按照指定的列进行合并操作。合并的方式可以是基于列的交集、并集,也可以是基于索引的合并。
函数的基本语法如下:
```
pd.merge(left, right, how='inner', on=None, left_on=None, right_on=None)
```
其中,`left`和`right`是要合并的两个DataFrame对象;`how`参数指定了合并的方式,包括'inner'(内连接)、'outer'(外连接)、'left'(左连接)和'right'(右连接);`on`参数指定了用于合并的列名,若两个DataFrame中的列名相同,则可以使用`on`参数进行指定;`left_on`和`right_on`参数分别指定了左右DataFrame中用于合并的列名,适用于列名不同的情况。
例如,如果有两个DataFrame对象df1和df2,它们分别如下所示:
```
df1:
key value1
0 A 1
1 B 2
2 C 3
df2:
key value2
0 B 4
1 C 5
2 D 6
```
我们可以使用pd.merge函数将这两个DataFrame按照key列进行内连接合并:
``` python
merged = pd.merge(df1, df2, on='key', how='inner')
```
合并后的结果为:
```
key value1 value2
0 B 2 4
1 C 3 5
```
这样,根据key列的取值,在df1和df2中共有的行被合并到了一起。
除了基本的合并操作,pd.merge函数还支持多表的合并、多列的合并以及不同合并方式的灵活组合。具体使用时可以参考官方文档或其他教程资源。
阅读全文