dataframe以前两列进行分类统计,计算第三列的平均值,并且将平均值添加到datafram下面
时间: 2024-10-17 08:12:11 浏览: 69
使用Python的Dataframe取两列时间值相差一年的所有行方法
在Pandas库中,如果你有一个DataFrame并且想要基于前两列(假设它们是'A'和'B'列)进行分组,然后计算第三列'C'的平均值,你可以使用`groupby`函数结合`mean`函数来实现。这里是一个示例:
```python
import pandas as pd
# 假设df是你需要操作的数据框
df_grouped = df.groupby(['A', 'B'])['C'].mean().reset_index()
# 这里,df_grouped就是新的DataFrame,其中包含了原始数据按照'A'和'B'列分组后的'C'列平均值
```
在这个新生成的`df_grouped`中,每一行代表一个(A, B)组合以及对应的"C"列平均值。
如果你想在原数据框`df`的基础上直接添加这个结果,可以考虑合并两个DataFrame,例如通过`concat`或者`append`:
```python
result_df = pd.concat([df, df_grouped], axis=0)
# 或者
result_df = df.append(df_grouped, ignore_index=True)
```
阅读全文