pd.merge的inner和哦outter的区别
时间: 2024-03-09 22:49:29 浏览: 43
pd.merge函数.pptx
`pd.merge()` 是 Pandas 中用于合并数据集的函数。它的 `how` 参数可以设置为 `inner` 或 `outer`,分别对应内连接和外连接。
内连接 (`inner`) 只会保留两个数据集中都存在的行,即只会保留两个数据集中都有匹配的值的行。
而外连接 (`outer`) 则会保留所有的行,对于缺失的值,会填充为缺失值 NaN。
举个例子,假设我们有两个数据集 `df1` 和 `df2`:
```
df1:
A B
0 1 a
1 2 b
2 3 c
df2:
A C
0 1 x
1 2 y
2 4 z
```
对于内连接,合并后的结果为:
```
pd.merge(df1, df2, on='A', how='inner')
A B C
0 1 a x
1 2 b y
```
对于外连接,合并后的结果为:
```
pd.merge(df1, df2, on='A', how='outer')
A B C
0 1 a x
1 2 b y
2 3 c NaN
3 4 NaN z
```
阅读全文