pandas分组聚合
时间: 2023-09-21 11:12:21 浏览: 91
pandas分组聚合详解
5星 · 资源好评率100%
Pandas中的分组聚合是一种常用的数据处理操作,用于基于某些特征将数据集拆分成不同的组,并对每个组应用聚合函数来计算汇总统计量。下面是一个简单的示例:
假设我们有一个包含"姓名"、"性别"和"年龄"的数据集,我们想要按照性别进行分组,并计算每个组的平均年龄和人数。
首先,我们导入pandas库并读取数据集:
``` python
import pandas as pd
data = {
'姓名': ['张三', '李四', '王五', '赵六', '小明', '小红'],
'性别': ['男', '男', '女', '男', '女', '女'],
'年龄': [25, 30, 27, 29, 32, 28]
}
df = pd.DataFrame(data)
```
然后,我们使用`groupby`方法根据"性别"进行分组,并应用聚合函数:
``` python
grouped_df = df.groupby('性别').agg({'年龄': ['mean', 'count']})
```
最后,我们可以打印出结果:
``` python
print(grouped_df)
```
输出:
```
年龄
mean count
性别
女 28.3 3
男 28.0 3
```
在这个示例中,我们首先使用`groupby`方法根据"性别"将数据集分成两组,然后使用`agg`方法计算每个组的平均年龄和人数。
除了平均值和计数之外,Pandas还提供了多种其他的聚合函数,如求和、最大值、最小值、中位数等。你可以根据需求选择适合的聚合函数来进行分组聚合操作。
阅读全文