python中的group by
时间: 2024-05-30 20:05:54 浏览: 39
详解python中groupby函数通俗易懂
3星 · 编辑精心推荐
在Python中,group by是一种数据操作技术,它将数据集合按照指定的属性进行分组,返回一个按照指定属性分组后的字典或者列表。这个技术可以用于数据分析和数据处理中,特别是在SQL和Pandas中,group by被广泛应用。
在Python中,可以使用pandas库来实现group by,pandas库提供了一个groupby()函数来实现数据的分组操作。示例代码如下:
```python
import pandas as pd
#创建一个数据集
data = {
'name':['Amy', 'Bob', 'Cathy', 'David', 'Emma', 'Frank'],
'age':[18, 20, 19, 21, 22, 20],
'gender':['female', 'male', 'female', 'male', 'female', 'male']
}
df = pd.DataFrame(data)
#按照性别分组
grouped = df.groupby('gender')
#统计每个组的数量
print(grouped.size())
#计算每个组的平均年龄
print(grouped['age'].mean())
```
输出结果为:
```
gender
female 3
male 3
dtype: int64
gender
female 19.666667
male 20.333333
Name: age, dtype: float64
```
其中,第一个结果为每个分组的数量,第二个结果为每个分组的平均年龄。这就是group by的基本操作。
阅读全文