pandas groupby函数 分析 解释 并举例
时间: 2024-05-13 13:20:19 浏览: 83
好的,关于 pandas 中的 groupby 函数,它可以用于对 DataFrame 数据按照某些列进行分组,然后对分组后的数据进行统计分析,如求和、平均值、最大值、最小值等等。比如我们有一份学生的成绩单 DataFrame 数据,可以按照班级进行分组,然后求出各个班级的平均成绩、最高成绩等等。下面是一个简单的例子:
```python
import pandas as pd
# 创建数据
data = pd.DataFrame({
'class': ['A', 'B', 'A', 'B', 'A', 'B'],
'name': ['John', 'Tom', 'Jerry', 'Lucy', 'Emma', 'Nick'],
'score': [90, 80, 95, 75, 92, 68]
})
# 按班级进行分组,并求各个班级的平均分
grouped = data.groupby('class')
print(grouped.mean())
# 输出结果:
# score
# class
# A 92.333333
# B 74.333333
```
在这个例子中,我们先创建了一个 DataFrame 数据,包含学生姓名、所在班级和成绩三列。然后我们按照班级进行分组,使用 `groupby` 函数实现。接着再对分组后的数据求平均值,使用 `mean` 函数实现。最终得出每个班级的平均分。
除了 `mean` 函数,groupby 函数还可以和其他的统计函数一起使用,比如 `sum`、`max`、`min`、`count` 等。此外,我们还可以在分组后的数据中使用 apply 方法,对每个分组进行进一步的操作,比如筛选、排序、统计等等。
阅读全文