pandas中groupby
时间: 2023-08-31 16:09:57 浏览: 105
pandas dataframe对象的分组机制groupby
Pandas中的groupby方法可以将数据按照给定的列进行分组,并对每个分组执行聚合函数。下面是一个groupby的基本用法示例:
```
import pandas as pd
# 创建一个示例DataFrame
df = pd.DataFrame({
'Group': ['A', 'A', 'B', 'B', 'C', 'C'],
'Value': [1, 2, 3, 4, 5, 6]
})
# 按照Group列进行分组,并对每组的Value列求平均值
grouped = df.groupby('Group').mean()
print(grouped)
```
输出结果为:
```
Value
Group
A 1.5
B 3.5
C 5.5
```
可以看到,数据被按照Group列的值进行了分组,并对每个分组的Value列求了平均值。
groupby方法可以和许多聚合函数一起使用,例如sum、count、max、min等等。可以通过传入一个字典来指定对哪些列使用哪些聚合函数。例如:
```
# 对每个分组的Value列求和,并对每个分组的Size列求平均值
grouped = df.groupby('Group').agg({'Value': 'sum', 'Size': 'mean'})
print(grouped)
```
输出结果为:
```
Value Size
Group
A 3 1.5
B 7 2.5
C 11 3.5
```
可以看到,对于每个分组,Value列的值被求和了,而Size列的值被求平均值了。
阅读全文