pd.merge使用方式
时间: 2023-09-27 13:08:27 浏览: 42
pd.merge是Pandas库中用于合并两个数据框的函数,其使用方式如下:
语法:
```python
pd.merge(left, right, how='inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=True, suffixes=('_x', '_y'), copy=True, indicator=False, validate=None)
```
参数说明:
- left:左侧数据集
- right:右侧数据集
- how:合并方式,包括'left', 'right', 'outer', 'inner'四种方式
- on:合并的列名,可以是单个列名或多个列名组成的列表
- left_on:左侧数据集中用于合并的列名
- right_on:右侧数据集中用于合并的列名
- left_index:是否将左侧数据集的索引用作合并键
- right_index:是否将右侧数据集的索引用作合并键
- suffixes:重复列名的后缀名
- sort:是否按照合并键进行排序
- copy:是否复制数据,避免原始数据被修改
- indicator:是否在结果中添加一列指示数据来自哪个数据集
- validate:检查合并的类型
示例:
```python
import pandas as pd
# 创建两个数据集
df1 = pd.DataFrame({'key': ['A', 'B', 'C', 'D'], 'value': [1, 2, 3, 4]})
df2 = pd.DataFrame({'key': ['B', 'D', 'E', 'F'], 'value': [5, 6, 7, 8]})
# 使用key列进行内连接
merged = pd.merge(df1, df2, on='key', how='inner')
print(merged)
```
输出结果:
```
key value_x value_y
0 B 2 5
1 D 4 6
```