python数据集左合并
时间: 2023-07-02 13:12:48 浏览: 54
在 Python 中,可以使用 `pandas` 库中的 `merge()` 函数实现数据集的左合并。左合并指的是将两个数据集按照左对齐合并成一个新的数据集,保留左侧数据集的所有行,同时将右侧数据集中与左侧数据集匹配的行合并到一起。
以下是一个示例代码,假设有两个数据集 `df1` 和 `df2`,它们分别有两列 `key` 和 `value`,我们需要将它们按照 `key` 列进行左合并:
``` python
import pandas as pd
# 定义数据集 df1 和 df2
data1 = {'key': ['A', 'B', 'C', 'D'], 'value': [1, 2, 3, 4]}
df1 = pd.DataFrame(data1)
data2 = {'key': ['B', 'D', 'E'], 'value': [5, 6, 7]}
df2 = pd.DataFrame(data2)
# 左合并 df1 和 df2
merged_df = pd.merge(df1, df2, on='key', how='left')
# 输出合并后的数据集
print(merged_df)
```
运行上述代码,输出合并后的数据集如下:
```
key value_x value_y
0 A 1 NaN
1 B 2 5.0
2 C 3 NaN
3 D 4 6.0
```
其中,`merged_df` 是合并后的数据集,`value_x` 和 `value_y` 分别是左侧数据集和右侧数据集中的 `value` 列,为了避免列名冲突,`merge()` 函数在合并时会自动为重复的列名添加后缀 `_x` 或 `_y`。在这个例子中,我们使用 `on='key'` 指定按照 `key` 列进行合并,`how='left'` 指定采用左合并方式。