python df.join函数
时间: 2023-10-19 17:24:33 浏览: 110
`df.join()` 是 Pandas 数据分析库中用于将两个数据表按照某些列进行连接的函数。它支持多种不同的连接类型(inner、outer、left、right),并且可以指定连接的列名、连接方式以及合并后的列名等参数。
下面是一个简单的例子,假设我们有两个数据表 `df1` 和 `df2`,它们分别包含了学生的姓名和成绩信息:
```
import pandas as pd
df1 = pd.DataFrame({
'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [18, 19, 20, 21],
})
df2 = pd.DataFrame({
'name': ['Alice', 'Charlie', 'Eve'],
'score': [90, 85, 95],
})
```
我们可以使用 `df.join()` 函数将它们按照姓名进行连接:
```
result = df1.join(df2.set_index('name'), on='name', how='left')
```
这里使用了 `df2.set_index('name')` 将 `df2` 中的 `name` 列设置为索引,然后使用 `on='name'` 指定连接的列名为 `name`,`how='left'` 表示使用左连接方式。合并后的结果如下:
```
name age score
0 Alice 18 90.0
1 Bob 19 NaN
2 Charlie 20 85.0
3 David 21 NaN
```
可以看到,合并后的结果包含了两个数据表中所有姓名的信息,并根据连接方式填充了缺失值。
阅读全文