pandas join
时间: 2023-07-01 11:20:32 浏览: 123
pandas 的 join 函数是用于将两个或多个 DataFrame 对象按照特定的键(key)连接起来,类似于 SQL 中的 JOIN 操作。join 函数有四种连接方式:左连接(left)、右连接(right)、内连接(inner)和外连接(outer)。
下面是一个简单的例子,假设有两个 DataFrame 对象 df1 和 df2:
```
import pandas as pd
df1 = pd.DataFrame({'key': ['A', 'B', 'C', 'D'], 'value': [1, 2, 3, 4]})
df2 = pd.DataFrame({'key': ['B', 'D', 'E', 'F'], 'value': [5, 6, 7, 8]})
```
现在我们想要按照 key 列对这两个 DataFrame 进行连接,可以使用 join 函数:
```
# 内连接
df_inner = pd.merge(df1, df2, on='key', how='inner')
print(df_inner)
# 左连接
df_left = pd.merge(df1, df2, on='key', how='left')
print(df_left)
# 右连接
df_right = pd.merge(df1, df2, on='key', how='right')
print(df_right)
# 外连接
df_outer = pd.merge(df1, df2, on='key', how='outer')
print(df_outer)
```
join 函数的参数说明:
- `left`: 左侧 DataFrame 对象。
- `right`: 右侧 DataFrame 对象。
- `on`: 连接键,可以是列名或者多个列名组成的列表。
- `how`: 连接方式,包括 left、right、inner、outer,默认是 inner。
- `left_on`: 左侧 DataFrame 中用作连接键的列名。
- `right_on`: 右侧 DataFrame 中用作连接键的列名。
- `suffixes`: 字符串或元组类型,用于区分重复列名的后缀。
阅读全文