pandas两个数据表合并
时间: 2024-09-13 21:15:16 浏览: 49
在pandas中,合并两个数据表通常可以使用`merge()`函数,它是DataFrame对象的重要操作之一。这个函数可以根据指定的键(key,即列名)将两个DataFrame按照某种规则连接起来。常见的合并方式有:
1. **内连接(inner join)**:默认情况下,只保留两个表中键值匹配的行。结果是一个新的DataFrame,包含两表共有部分的数据。
2. **外连接(outer join)**:包括所有左表(left DataFrame)的行,如果右表(right DataFrame)中没有匹配项,则对应值设为NaN。
3. **左连接(left join)**:返回左表的所有行,以及右表中匹配到的部分。如果没有匹配,右边的值是NaN。
4. **右连接(right join)**:与左连接相反,返回右表的所有行,以及左表中匹配到的部分。
你可以通过传递参数如`how='inner'`、`how='outer'`、`how='left'`或`how='right'`来指定合并类型。同时,还可以选择其他列作为合并键,或者设置一些额外的条件(例如`on`, `left_on`, `right_on`等)。
示例代码如下:
```python
import pandas as pd
# 假设有两个DataFrame df1和df2
df1 = pd.DataFrame({'key': ['A', 'B', 'C'], 'value1': [1, 2, 3]})
df2 = pd.DataFrame({'key': ['B', 'D', 'E'], 'value2': [4, 5, 6]})
# 内连接示例
merged_df = pd.merge(df1, df2, on='key')
```
阅读全文