python groupby分组后计算
时间: 2023-12-06 18:05:08 浏览: 123
在Python中,groupby是一种非常有用的数据分组方法,它可以将数据按照指定的列进行分组,并对每个分组进行计算。在分组后,我们可以使用agg()函数来对每个分组进行多个计算,例如求和、平均值、标准差等。此外,我们还可以使用apply()函数来对每个分组进行自定义计算。在groupby分组后,我们可以使用mean()函数来计算每个分组的平均值,使用sum()函数来计算每个分组的总和,使用std()函数来计算每个分组的标准差等。通过这些方法,我们可以更加方便地对数据进行分析和处理。
举例如下:
1. 对评分人数进行分组,将其分为六个等级,并对每个等级进行标记。
bins=np.percentile(df['评分人数'],[0,20,40,60,80,100])
pd.cut(df['评分人数'],bins=bins,labels=list('EDCBA'))
2. 对数据进行多个分组,并使用agg()函数计算每个分组的总和、平均值和标准差。
DataFrame groupby使用 agg()运算多个分组
A.groupby( [“班级”,“性别”]).agg([np.sum, np.mean, np.std])
3. 对时间序列进行分组,并按照年份或月份进行分组计算。
A.groupby(A[“生日”].apply(lambda x:x.year)).count()
A.groupby(A[“生日”].apply(lambda x:x.month),as_index=False).filter(lambda x: len(x)==1)
4. 对数据进行分组,并计算每个分组的平均值。
df[‘1’].groupby([df[‘1’],df[‘2’]]).mean()
阅读全文