pd.merge()的使用
时间: 2024-08-28 08:04:22 浏览: 46
`pd.merge()` 是Pandas库中的一个函数,用于合并两个数据集。这个函数可以实现类似于数据库中JOIN操作的功能,可以用来根据一个或多个键将不同的数据集行合并起来。
`pd.merge()` 主要有以下几种合并方式:
1. 默认的合并是内连接(inner join),它只返回两个数据集中共有的键。
2. 外连接(outer join),它返回两个数据集中的所有键。
3. 左连接(left join),返回左数据集的所有行,并在右数据集中寻找匹配的键。
4. 右连接(right join),返回右数据集的所有行,并在左数据集中寻找匹配的键。
以下是`pd.merge()`的基本用法示例:
```python
import pandas as pd
# 创建两个数据集
df1 = pd.DataFrame({'key': ['K0', 'K1', 'K2', 'K3'],
'A': ['A0', 'A1', 'A2', 'A3'],
'B': ['B0', 'B1', 'B2', 'B3']})
df2 = pd.DataFrame({'key': ['K0', 'K1', 'K2', 'K3'],
'C': ['C0', 'C1', 'C2', 'C3'],
'D': ['D0', 'D1', 'D2', 'D3']})
# 使用pd.merge()合并数据集
df3 = pd.merge(df1, df2, on='key') # 默认为内连接
```
在上述示例中,`df1` 和 `df2` 根据 `'key'` 列合并,合并后的结果存储在 `df3` 中。
阅读全文