python数据分组聚合
时间: 2023-09-21 11:11:02 浏览: 178
聚类python
在Python中,可以使用pandas库来进行数据分组聚合。以下是一个简单的例子:
假设有一组学生成绩数据,包括姓名、科目和成绩:
| 姓名 | 科目 | 成绩 |
| --- | --- | --- |
| 张三 | 数学 | 90 |
| 李四 | 数学 | 80 |
| 王五 | 数学 | 85 |
| 张三 | 英语 | 85 |
| 李四 | 英语 | 90 |
| 王五 | 英语 | 95 |
现在需要按照姓名来计算每个人的平均成绩。可以使用pandas的groupby函数来实现:
```python
import pandas as pd
# 创建数据
data = {"姓名": ["张三", "李四", "王五", "张三", "李四", "王五"],
"科目": ["数学", "数学", "数学", "英语", "英语", "英语"],
"成绩": [90, 80, 85, 85, 90, 95]}
df = pd.DataFrame(data)
# 按照姓名进行分组,并计算平均成绩
result = df.groupby("姓名")["成绩"].mean()
print(result)
```
输出结果为:
```
姓名
张三 87.5
李四 85.0
王五 90.0
Name: 成绩, dtype: float64
```
通过以上代码,我们成功将数据按照姓名分组,并计算出每个人的平均成绩。这只是一个简单的示例,实际上pandas提供了非常丰富的数据分组和聚合函数,可以满足各种需求。
阅读全文