pandas中groupby
时间: 2023-07-12 15:48:07 浏览: 88
pandas dataframe对象的分组机制groupby
Pandas中的groupby函数可以用于对数据进行分组和聚合操作,常用于数据分析和统计。groupby函数的一般用法为:
```
DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=False, observed=False, **kwargs)
```
其中,最常用的参数为by,它可以指定按照哪些列进行分组。例如:
```
import pandas as pd
data = {'Name': ['Alice', 'Bob', 'Charlie', 'Alice', 'Bob', 'Charlie'],
'Subject': ['Math', 'Math', 'Math', 'Science', 'Science', 'Science'],
'Score': [80, 90, 85, 95, 92, 89]}
df = pd.DataFrame(data)
# 按照Name列进行分组,并计算每个分组的平均值
result = df.groupby('Name').mean()
print(result)
```
输出结果为:
```
Score
Name
Alice 87.5
Bob 91.0
Charlie 87.0
```
上述代码中,我们按照Name列进行分组,并对每个分组的Score列求均值。最终得到了每个人的平均成绩。需要注意的是,groupby函数返回的是一个GroupBy对象,我们可以对其进行各种聚合操作,例如mean、sum、count等。
阅读全文