pandas merge讲解
时间: 2024-10-22 11:02:37 浏览: 32
Pandas库中的`merge()`函数是数据处理中的核心操作之一,用于将两个或多个DataFrame通过某种键(key)关联起来,生成一个新的DataFrame。它基于列之间的相似性,可以执行内连接(inner join)、左连接(left join)、右连接(right join)、外连接(outer join)等不同类型的合并。
**基本语法**:
```python
merged_df = pd.merge(left_df, right_df, on='key_column', how='type_of_join')
```
其中:
- `left_df` 和 `right_df` 是要合并的数据框。
- `'key_column'` 是这两个数据框共享的列名,用来作为合并依据。
- `'type_of_join'` 可能的值有 'inner', 'left', 'right', 'outer',分别对应内连接、左连接、右连接和全连接。
**示例**:
```python
# 假设df1是员工信息,df2是部门信息
left_df = pd.DataFrame({'EmployeeID': [1, 2, 3], 'Name': ['Tom', 'Nick', 'John']})
right_df = pd.DataFrame({'DepartmentID': [101, 102], 'DepartmentName': ['Sales', 'Marketing']})
# 内连接,只保留两边都有匹配项的记录
merged_df = pd.merge(left_df, right_df, on='EmployeeID', how='inner')
# 输出结果是一个新的DataFrame,包含共同的员工ID和对应的部门名称
```
阅读全文