pandas依据某列的值将数据划分
时间: 2023-08-15 12:43:25 浏览: 85
pandas对dataFrame中某一个列的数据进行处理的方法
5星 · 资源好评率100%
要按照某列的值将数据划分,可以使用Pandas的groupby函数。假设有一个DataFrame数据,其中包含学生的姓名、班级和成绩,可以按照班级将数据划分,并计算每个班级的平均成绩,可以按照以下步骤实现:
1. 导入Pandas库:
```
import pandas as pd
```
2. 创建DataFrame数据:
```
data = {'name': ['Tom', 'Jerry', 'Mike', 'Mary', 'Jack', 'John'],
'class': ['A', 'B', 'A', 'B', 'B', 'A'],
'score': [80, 90, 70, 85, 95, 75]}
df = pd.DataFrame(data)
```
3. 按照班级分组并计算平均成绩:
```
df.groupby('class')['score'].mean()
```
完整的代码如下:
```
import pandas as pd
# 创建DataFrame数据
data = {'name': ['Tom', 'Jerry', 'Mike', 'Mary', 'Jack', 'John'],
'class': ['A', 'B', 'A', 'B', 'B', 'A'],
'score': [80, 90, 70, 85, 95, 75]}
df = pd.DataFrame(data)
# 按照班级分组并计算平均成绩
df.groupby('class')['score'].mean()
```
输出结果为:
```
class
A 75.0
B 90.0
Name: score, dtype: float64
```
其中,第一列是班级,第二列是平均成绩。
阅读全文