将dataframe分组的变成新的
时间: 2023-12-03 11:12:29 浏览: 70
spark dataframe 将一列展开,把该列所有值都变成新列的方法
好的,我明白了。你的问题是如何将一个DataFrame按照指定的列分组,并将结果汇总成一个新的DataFrame。这可以使用Pandas库中的groupby函数来实现。
首先,你需要导入Pandas库并读入原始数据。然后,你可以使用groupby函数按照指定的列进行分组,并对每个分组进行汇总计算。最后,你可以将所有分组的结果合并成一个新的DataFrame。
下面是一个示例代码,可以供你参考:
```python
import pandas as pd
# 读入原始数据
df = pd.read_csv('data.csv')
# 按照指定的列进行分组,并对每个分组进行汇总计算
grouped = df.groupby('column_name').agg({'column_to_sum': 'sum', 'column_to_average': 'mean'})
# 将所有分组的结果合并成一个新的DataFrame
new_df = pd.DataFrame({'column_name': grouped.index, 'sum': grouped['column_to_sum'], 'average': grouped['column_to_average']})
```
你需要将上述代码中的"column_name"替换成你要分组的列的名称,"column_to_sum"替换成你要求和的列的名称,"column_to_average"替换成你要求平均值的列的名称。最后,将"new_df"作为分组结果的新DataFrame。
阅读全文