pandas库中的data.groupby
时间: 2023-11-12 12:46:35 浏览: 84
是用来实现数据分组操作的函数。groupby()函数可以将数据集按照指定的列或多个列进行分组,并返回一个GroupBy对象,可以通过该对象进行进一步的聚合、筛选等操作。
使用groupby()函数的一般流程如下:
1. 指定分组列或多个列:通过传入一个或多个列名作为groupby()函数的参数,指定要进行分组的列。
2. 聚合操作:可以对分组后的数据进行聚合操作,如计算总和、平均值、最大值等。可以使用聚合函数(如sum()、mean()、max()等)对GroupBy对象进行调用。
3. 数据筛选:可以根据分组后的数据进行筛选操作,比如选择特定组别的数据。
下面是一个示例,演示如何使用groupby()函数:
```python
import pandas as pd
# 创建DataFrame示例
data = {'Animal': ['Cat', 'Dog', 'Cat', 'Dog', 'Dog'],
'Age': [4, 2, 3, 5, 1],
'Weight': [8, 12, 9, 15, 6]}
df = pd.DataFrame(data)
# 按照动物类型进行分组,并计算平均年龄和总体重
grouped = df.groupby('Animal')
result = grouped.agg({'Age': 'mean', 'Weight': 'sum'})
print(result)
```
输出结果如下:
```
Age Weight
Animal
Cat 3.5 17
Dog 2.666667 33
```
在上面的示例中,我们按照"Animal"列进行了分组,并计算了每种动物类型的平均年龄和总体重。
阅读全文