pd.merge() 函数的用法
时间: 2024-05-10 17:03:14 浏览: 159
`pd.merge()` 是 Pandas 库中用于合并数据的函数。它可以基于一个或多个公共列将两个 DataFrame 对象进行合并。合并操作可以类比于关系型数据库中的 JOIN 操作。
`pd.merge()` 函数的基本语法如下:
```python
pd.merge(left, right, how='inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=False)
```
参数说明:
- `left` 和 `right`:要合并的左右 DataFrame 对象。
- `how`:合并方式,可选值为 'inner'(默认)、'outer'、'left'、'right'。
- `on`:指定要基于哪个列进行合并,如果 left 和 right 中的列名相同,可以直接指定这个参数。
- `left_on` 和 `right_on`:如果左右 DataFrame 对象需要基于不同的列进行合并,则分别指定这两个参数。
- `left_index` 和 `right_index`:如果需要基于索引进行合并,则将对应参数设置为 True。
- `sort`:是否按照合并列的字典顺序对结果进行排序,默认为 False。
例如,以下代码演示了使用 `pd.merge()` 函数进行内连接的操作:
```python
import pandas as pd
# 创建两个示例 DataFrame
df1 = pd.DataFrame({'key': ['A', 'B', 'C', 'D'],
'value': [1, 2, 3, 4]})
df2 = pd.DataFrame({'key': ['B', 'D', 'E', 'F'],
'value': [5, 6, 7, 8]})
# 使用 pd.merge() 进行内连接
merged_inner = pd.merge(df1, df2, on='key', how='inner')
print(merged_inner)
```
输出结果为:
```
key value_x value_y
0 B 2 5
1 D 4 6
```
以上代码中,`pd.merge(df1, df2, on='key', how='inner')` 表示对 `df1` 和 `df2` 进行内连接,即基于 'key' 列合并两个 DataFrame,只保留两个 DataFrame 中 'key' 列取值的交集,并将结果存储在 `merged_inner` 变量中。
阅读全文