pd.merge how 怎么用?
时间: 2023-09-27 15:03:59 浏览: 121
`pd.merge()` 是 Pandas 库中用于合并数据的函数。它可以根据一个或多个键将不同的 DataFrame 对象合并在一起。
函数语法如下:
```python
pd.merge(left, right, how='inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=False, suffixes=('_x', '_y'), copy=True, indicator=False, validate=None)
```
参数说明:
- `left`:要合并的左侧 DataFrame。
- `right`:要合并的右侧 DataFrame。
- `how`:合并方式,可选值包括 `inner`(取交集)、`outer`(取并集)、`left`(以左侧 DataFrame 为准)、`right`(以右侧 DataFrame 为准)。
- `on`:要合并的列名,必须同时存在于左右两个 DataFrame 中。
- `left_on`:左侧 DataFrame 中用作合并键的列名。
- `right_on`:右侧 DataFrame 中用作合并键的列名。
- `left_index`:是否使用左侧 DataFrame 的索引作为合并键。
- `right_index`:是否使用右侧 DataFrame 的索引作为合并键。
- `sort`:是否按照合并键进行排序。
- `suffixes`:如果左右 DataFrame 存在相同的列名,用于指定列名后缀的元组。
- `copy`:是否在合并时复制数据。
- `indicator`:是否添加 `_merge` 列,用于指示合并方式。
- `validate`:是否检查合并键是否有效。
示例代码:
```python
import pandas as pd
# 创建两个 DataFrame
df1 = pd.DataFrame({
'key': ['A', 'B', 'C', 'D'],
'value': [1, 2, 3, 4]
})
df2 = pd.DataFrame({
'key': ['B', 'D', 'E', 'F'],
'value': [5, 6, 7, 8]
})
# 根据 key 列进行内连接
df3 = pd.merge(df1, df2, on='key', how='inner')
print(df3)
```
输出结果:
```
key value_x value_y
0 B 2 5
1 D 4 6
```
在这个例子中,我们首先创建了两个 DataFrame,然后使用 `pd.merge()` 函数将它们根据 `key` 列进行内连接。由于 `key` 列中只有 `'B'` 和 `'D'` 这两个值同时存在于两个 DataFrame 中,因此最终合并的结果只包含这两行数据。
阅读全文