groupby函数
时间: 2023-07-26 22:03:23 浏览: 89
groupby函数是pandas库中非常常用的函数之一。它通常用于将数据按照某个或某些列进行分组,然后对分组后的数据进行聚合操作。
具体来说,groupby函数的语法如下:
```
grouped = df.groupby(key)
```
其中,df是一个DataFrame对象,key是一个列名或者列名列表,表示按照这些列进行分组。grouped是一个GroupBy对象,它包含了分组后的数据以及一些聚合函数。
例如,我们有如下的数据表:
```
import pandas as pd
df = pd.DataFrame({
'name': ['Alice', 'Bob', 'Charlie', 'Alice', 'Bob', 'Charlie'],
'score': [80, 90, 85, 95, 92, 88]
})
```
我们可以按照name列进行分组,并计算每个分组的平均分数:
```
grouped = df.groupby('name')
grouped.mean()
```
输出结果为:
```
score
name
Alice 87.5
Bob 91.0
Charlie 86.5
```
这里我们使用了mean函数对分组后的数据进行求平均值的操作。除了mean函数,groupby还支持其他一些聚合函数,比如sum、count、max、min等。此外,我们还可以使用agg函数对分组后的数据进行自定义的聚合操作。
阅读全文