groupby的使用
时间: 2023-11-09 13:00:14 浏览: 91
MySQL优化GROUP BY(松散索引扫描与紧凑索引扫描)
groupby是pandas中非常常用的一个函数,它可以根据某一列或多列的值进行分组,然后对每个分组进行聚合操作。下面是一个简单的例子:
假设我们有一个数据集,包含了学生的姓名、性别、年龄和成绩四个字段,我们想要按照性别进行分组,然后计算每个性别的平均年龄和平均成绩,可以使用如下代码:
```python
import pandas as pd
# 创建数据集
data = {
'name': ['Alice', 'Bob', 'Charlie', 'David', 'Eva', 'Frank'],
'gender': ['F', 'M', 'M', 'M', 'F', 'M'],
'age': [18, 19, 20, 21, 22, 23],
'score': [80, 85, 90, 95, 100, 105]
}
df = pd.DataFrame(data)
# 按照性别进行分组,并计算平均年龄和平均成绩
result = df.groupby('gender').agg({'age': 'mean', 'score': 'mean'})
print(result)
```
输出结果为:
```
age score
gender
F 20.000000 90.000000
M 21.333333 95.000000
```
可以看到,我们成功地按照性别进行了分组,并计算出了每个性别的平均年龄和平均成绩。
阅读全文