dataframe的groupby如何使用
时间: 2023-07-20 22:06:42 浏览: 82
Pandas中的groupby函数可以按照指定的一列或多列对数据进行分组,然后进行聚合操作。下面是一个简单的示例:
```python
import pandas as pd
# 创建一个示例数据集
data = {'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Emily', 'Frank'],
'Gender': ['Female', 'Male', 'Male', 'Male', 'Female', 'Male'],
'Age': [25, 32, 18, 47, 23, 36],
'Score': [80, 90, 70, 85, 92, 88]}
df = pd.DataFrame(data)
# 按照Gender列进行分组,计算平均年龄和平均分数
grouped = df.groupby('Gender')
result = grouped.agg({'Age': 'mean', 'Score': 'mean'})
print(result)
```
输出结果:
```
Age Score
Gender
Female 24.000000 86.000000
Male 31.166667 87.666667
```
在这个例子中,我们按照Gender列进行分组,然后对每组数据计算平均年龄和平均分数。我们使用`groupby`函数对数据进行分组,然后使用`agg`函数对每个组进行聚合操作。`agg`函数的参数是一个字典,键是要聚合的列名,值是要应用于该列的聚合函数。在这个例子中,我们使用`mean`函数计算平均值。
阅读全文