DataFrame.merge
时间: 2023-11-03 13:53:42 浏览: 135
如何使用pd.merge()函数和DataFrame的join()方法在Pandas中合并数据集
DataFrame.merge 是 pandas 库中用于合并两个 DataFrame 的函数。它根据指定的列或索引进行连接,并返回一个新的 DataFrame。合并可以根据一对一、多对一或多对多的关系进行。
使用 DataFrame.merge 可以通过以下方式合并两个 DataFrame:
- 内连接(inner join): 只保留两个 DataFrame 中共有的行。
- 左连接(left join): 保留左侧 DataFrame 中的所有行,并将右侧 DataFrame 中匹配的行合并。
- 右连接(right join): 保留右侧 DataFrame 中的所有行,并将左侧 DataFrame 中匹配的行合并。
- 外连接(outer join): 保留两个 DataFrame 中的所有行,并将匹配的行合并。
DataFrame.merge 函数有多个参数,其中最重要的是 `on` 参数,用于指定根据哪些列进行合并。还可以使用 `how` 参数来指定合并方式,默认为内连接。
以下是一个示例:
```python
import pandas as pd
df1 = pd.DataFrame({'A': [1, 2, 3], 'B': ['a', 'b', 'c']})
df2 = pd.DataFrame({'A': [3, 4, 5], 'C': ['x', 'y', 'z']})
merged_df = df1.merge(df2, on='A', how='inner')
print(merged_df)
```
输出结果为:
```
A B C
0 3 c x
```
在此示例中,我们根据列 'A' 进行内连接,合并了两个 DataFrame,并只保留了匹配的行。
阅读全文