pandas join 函数
时间: 2023-10-16 20:29:54 浏览: 99
使用pandas对两个dataframe进行join的实例
pandas join 函数用于将两个 DataFrame 按照指定的列或索引进行合并。
语法:
```python
DataFrame.join(other, on=None, how='left', lsuffix='', rsuffix='', sort=False)
```
参数说明:
- `other`:要合并的另一个 DataFrame。
- `on`:用于合并的列或索引,必须在两个 DataFrame 中都存在。
- `how`:合并方式,可选值包括 'left', 'right', 'outer', 'inner',默认为 'left'。
- `lsuffix` 和 `rsuffix`:用于区分两个 DataFrame 中重名列的后缀。
- `sort`:是否按照合并列或索引排序,默认为 False。
示例:
```python
import pandas as pd
# 创建两个 DataFrame
df1 = pd.DataFrame({'key': ['A', 'B', 'C', 'D'], 'value': [1, 2, 3, 4]})
df2 = pd.DataFrame({'key': ['B', 'D', 'E', 'F'], 'value': [5, 6, 7, 8]})
# 按照 key 列合并两个 DataFrame
result = df1.join(df2.set_index('key'), on='key', rsuffix='_right')
print(result)
```
输出结果如下:
```
key value value_right
0 A 1 NaN
1 B 2 5.0
2 C 3 NaN
3 D 4 6.0
```
可以看到,按照 key 列合并后,只保留了两个 DataFrame 中都存在的行,同时右侧 DataFrame 中没有对应行的值被填充为 NaN。
阅读全文