dataframe 分组
时间: 2023-11-18 20:53:27 浏览: 84
pandas dataframe对象的分组机制groupby
好的,关于 dataframe 分组,我可以给你一些基本的介绍。
在 pandas 中,我们可以使用 groupby() 方法对 dataframe 进行分组操作。groupby() 方法会根据指定的列或者多个列的值进行分组,然后对每个分组进行聚合操作。
例如,我们有一个包含学生姓名、科目和成绩的 dataframe,我们可以使用 groupby() 方法按照科目对学生进行分组,然后计算每个科目的平均成绩:
```python
import pandas as pd
# 创建 dataframe
df = pd.DataFrame({
'name': ['Alice', 'Bob', 'Charlie', 'David', 'Emily', 'Frank'],
'subject': ['Math', 'English', 'Math', 'English', 'Math', 'English'],
'score': [80, 75, 90, 85, 95, 70]
})
# 按照科目分组,计算平均成绩
grouped = df.groupby('subject')
mean_scores = grouped.mean()
print(mean_scores)
```
输出结果为:
```
score
subject
English 76.666667
Math 88.333333
```
在上面的例子中,我们首先使用 groupby() 方法按照科目对 dataframe 进行分组,然后使用 mean() 方法计算每个分组的平均值。
阅读全文