pandas分组聚合详解_pandas分组 - CSDN文库

5星 · 超过95%的资源 158 浏览量更新于2023-10-20 评论收藏 59KB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

资源详情

资源评论

资源推荐

pandas分组聚合详解分组聚合详解

主要介绍了pandas分组聚合详解，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考

学习价值，需要的朋友们下面随着小编来一起学习学习吧

一一前言前言

pandas学到分组迭代，那么基础的pandas系列就学的差不多了，自我感觉不错，知识追寻者用pandas处理过一些数据，蛮好

用的；

知识追寻者(Inheriting the spirit of open source, Spreading technology knowledge;)

二二分组分组

2.1 数据准备数据准备

# -*- coding: utf-8 -*-

import pandas as pd

import numpy as np

frame = pd.DataFrame({

'user' : ['zszxz','craler','rose','zszxz','rose'],

'hobby' : ['reading','running','hiking','reading','hiking'],

'price' : np.random.randn(5),

'number' : np.random.randn(5)

})

print(frame)

输出

user hobby price number

0 zszxz reading 0.275752 -0.075841

1 craler running -1.410682 0.259869

2 rose hiking -0.353269 -0.392659

3 zszxz reading 1.484604 0.659274

4 rose hiking -1.348315 2.492047

2.2 分组求均值分组求均值

提取DataFrame中price 列，根据hobby列进行分组，最后对分好组的数据进行处理求均值；

# 是个生成器

group = frame['price'].groupby(frame['hobby'])

# 求均值

print(group.mean())

输出

hobby

hiking -0.850792

reading 0.880178

running -1.410682

Name: price, dtype: float64

Tip: 可以理解为根据爱好分组，查询价格；查询的列必须是数字，否则求均值时会报异常

如果是根据多列分组则在groupby后面使用列表指定，并且调用求均值函数；输出的值将是分组列，均值结果；

group = frame['price'].groupby([frame['hobby'],frame['user']])

print(group.mean())

输出

hobby user

hiking rose 0.063972

reading zszxz 0.393164

running craler -1.395186

Name: price, dtype: float64

如果对整个DataFrame进行分组，则不再需要提取指定的列；

group = frame.groupby(frame['hobby'])

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余3页未读，立即下载

评论10

番皂泡

2023-06-19

很实用的一篇文章，让我对pandas的聚合应用更加了解了。

weixin_38618140

粉丝: 9
资源: 908

会员权益专享

图片转文字

全年可省5，000元立即开通

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈