利用pandas进行同类合并
时间: 2023-11-03 09:17:06 浏览: 28
要利用 pandas 进行同类合并,可以使用 pandas 库中的 merge 函数。假设有两个数据集,分别为 df1 和 df2,它们都包含一个名为 category 的列,我们可以按照 category 列进行合并,合并后的结果如下:
```python
import pandas as pd
# 创建 df1 数据集
data1 = {'category': ['A', 'B', 'C', 'D'], 'value1': [1, 2, 3, 4]}
df1 = pd.DataFrame(data1)
# 创建 df2 数据集
data2 = {'category': ['B', 'C', 'E', 'F'], 'value2': [5, 6, 7, 8]}
df2 = pd.DataFrame(data2)
# 按照 category 列进行合并
merged_df = pd.merge(df1, df2, on='category', how='outer')
# 输出合并后的结果
print(merged_df)
```
执行以上代码后,输出的结果如下:
```
category value1 value2
0 A 1.0 NaN
1 B 2.0 5.0
2 C 3.0 6.0
3 D 4.0 NaN
4 E NaN 7.0
5 F NaN 8.0
```
可以看到,合并后的结果包含了同类的数据,并且缺失的值被填充为 NaN。