我有两个dataframe,都有三个相同的列,我要将两个dataframe合并成一个,如果一行中前两列的值一样,则新表将两个表的第三列数据值相加,不过不存在相同的值,就直接写入新表中,帮我写出代码
时间: 2024-09-21 17:11:50 浏览: 49
你可以使用pandas库中的`merge`函数配合`groupby`和`transform`功能来实现这个需求。这里是一个简单的Python示例:
```python
import pandas as pd
# 假设df1和df2是你想要合并的两个DataFrame
df1 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]})
df2 = pd.DataFrame({'A': [1, 3, 4], 'B': [10, 6, 12], 'C': [14, 16, 18]})
# 使用 merge 进行内连接,然后 groupby A 和 B 列求和
merged_df = pd.merge(df1, df2, on=['A', 'B'], how='outer')
# 如果A和B的组合在任一DataFrame中都不存在,那么在新表中直接保留原始值
# 否则对C列进行求和
merged_df['C'] = merged_df.groupby(['A', 'B'])['C_x'].transform('sum') + merged_df.groupby(['A', 'B'])['C_y'].transform('sum').fillna(0)
# 删除不需要的列名 _x 和 _y
merged_df = merged_df.rename(columns={'C_x': 'C1', 'C_y': 'C2'}).drop(columns='_merge')
print(merged_df)
```
在这个例子中,`_merge`列用于标识来源,最后我们将其删除。如果存在相同的(A, B)值,`transform('sum')`会将df1和df2中的C列对应值相加。
阅读全文