pandas的merge用法连接两个表里面的数据
时间: 2024-12-20 18:19:40 浏览: 3
详解Python3 pandas.merge用法
Pandas库中的`merge()`函数是用于结合(join)两个或更多的DataFrame对象,通常基于它们共享的列(键)。这个函数允许你在数据集中合并相关的记录,形成一个新的DataFrame。基本语法如下:
```python
pd.merge(left_df, right_df, on='key_column', how='inner', [other parameters...])
```
其中:
- `left_df` 和 `right_df` 是要合并的两个DataFrame。
- `'key_column'` 是两个DataFrame中用于匹配的共同列名,也称为键(Key)。
- `how` 参数可以有多种选择,如 'inner'(默认),表示只保留两个DataFrame中都存在的行;'outer' 表示保留所有行;'left' 只保留左表中的行;'right' 只保留右表中的行。
- 其他参数还包括 `left_on`, `right_on`(如果键列名称不同),以及 `suffixes` (合并后的列名后缀)等,用于指定更详细的合并规则。
例如,假设我们有两个DataFrame,`df1` 和 `df2` 都有一个名为`ID`的列,我们可以这样做:
```python
merged_df = pd.merge(df1, df2, on='ID')
```
这将创建一个新的DataFrame,其中包含了来自 `df1` 和 `df2` 的所有列,且 `ID` 列的值相匹配。
阅读全文