pandas中groupby的用法
时间: 2024-05-30 07:05:54 浏览: 98
3.Pandas应用 GroupBy
在pandas中,groupby()是一个常用的数据分组函数,其作用是将一个数据集按照某些特征进行分组,然后对每个分组进行相应的计算和处理。
具体用法如下:
首先,通过DataFrame对象调用groupby()方法并传入需要分组的列名或列名列表进行分组,例如:
```
import pandas as pd
df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],
'B': ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'],
'C': [1, 2, 3, 4, 5, 6, 7, 8],
'D': [10, 20, 30, 40, 50, 60, 70, 80]})
grouped = df.groupby('A')
```
这样就按照列名'A'进行了分组。接着可以使用各种聚合函数对数据进行分组后的计算,例如:
```
grouped.sum()
```
这将对每个分组进行求和操作并返回结果,结果如下:
```
C D
A
bar 12 120
foo 24 270
```
除了sum()方法外,还有很多其他聚合函数可以使用,例如mean()、count()、min()、max()等。
在groupby()中还可以传入多个列名进行多重分组。例如:
```
grouped = df.groupby(['A', 'B'])
```
这样就按照列名'A'和'B'进行了多重分组。同样可以使用各种聚合函数对数据进行分组后的计算。
阅读全文