df.groupby()函数
时间: 2023-12-15 17:32:55 浏览: 64
`df.groupby()`函数是pandas库中的一个函数,主要用于对数据进行分组和分组后的聚合操作。函数可以根据指定的列对数据进行分组,然后对每个分组进行聚合操作,例如计算每个分组的平均值、总和、最大值、最小值等等。
下面是一个示例,假设我们有一个包含学生姓名、科目和成绩的数据集,我们想要按照科目对数据进行分组,并计算每个科目的平均成绩:
```python
import pandas as pd
# 创建数据集
data = {'Name': ['Tom', 'Jack', 'Tom', 'Jack', 'Tom', 'Jack', 'Tom', 'Tom'],
'Subject': ['Math', 'Math', 'English', 'English', 'Science', 'Science', 'Math', 'Science'],
'Score': [70, 80, 90, 85, 95, 75, 80, 85]}
df = pd.DataFrame(data)
# 按照科目进行分组,并计算每个科目的平均成绩
grouped = df.groupby('Subject')['Score'].mean()
print(grouped)
```
输出结果为:
```
Subject
English 87.5
Math 76.666667
Science 85.0
Name: Score, dtype: float64
```
上述代码中,我们首先创建了一个包含学生姓名、科目和成绩的数据集,然后使用`df.groupby()`函数按照科目对数据进行分组,并使用`mean()`函数计算每个科目的平均成绩。
阅读全文