pd.merge左右拼接
时间: 2023-10-12 18:12:32 浏览: 124
`pd.merge` 是 pandas 库中的一个函数,用于将两个 DataFrame 进行合并。左右拼接是其中一种方式,可以通过指定 `how` 参数来实现。
具体来说,左右拼接是指将两个 DataFrame 按照它们的列进行拼接,其中一个 DataFrame 的所有行都会保留,而另一个 DataFrame 可能会有部分行被丢弃(如果没有匹配的行)。具体实现方式是,以左边的 DataFrame 为基准,将右边的 DataFrame 按照指定的列与左边的 DataFrame 进行匹配,匹配成功的行就会被拼接到左边的 DataFrame 中,而没有匹配成功的行则会被丢弃。
下面是一个示例:
``` python
import pandas as pd
# 创建两个 DataFrame
df1 = pd.DataFrame({'key': ['a', 'b', 'c'], 'value': [1, 2, 3]})
df2 = pd.DataFrame({'key': ['b', 'c', 'd'], 'value': [4, 5, 6]})
# 进行左右拼接
result = pd.merge(df1, df2, on='key', how='left')
print(result)
```
输出:
```
key value_x value_y
0 a 1 NaN
1 b 2 4.0
2 c 3 5.0
```
可以看到,`result` DataFrame 中保留了左边的 DataFrame 中的所有行,并按照 'key' 列与右边的 DataFrame 进行匹配。匹配成功的行被拼接到左边的 DataFrame 中,并在列名后面添加了 '_y' 后缀。没有匹配成功的行则在 '_y' 列中填充了 NaN。
阅读全文