python pandas 分组再分组
时间: 2023-10-13 17:06:21 浏览: 191
在 pandas 中,可以使用 groupby() 方法进行分组操作。如果需要再对分组后的数据进行进一步的分组操作,可以再次使用 groupby() 方法。
例如,有一个包含销售数据的 DataFrame,需要先按照产品类型进行分组,然后再按照销售地区进行分组:
```python
import pandas as pd
# 创建 DataFrame
data = {'产品类型': ['A', 'B', 'A', 'B', 'A', 'B'],
'销售地区': ['华东', '华东', '华北', '华北', '华南', '华南'],
'销售额': [100, 200, 300, 400, 500, 600]}
df = pd.DataFrame(data)
# 按照产品类型和销售地区分组,并计算销售额的和
grouped = df.groupby(['产品类型', '销售地区'])['销售额'].sum()
print(grouped)
```
输出结果为:
```
产品类型 销售地区
A 华北 300
华南 500
华东 100
B 华北 400
华南 600
华东 200
Name: 销售额, dtype: int64
```
可以看到,按照产品类型和销售地区进行了分组,并计算了销售额的和。
如果需要再按照销售地区进行进一步的分组,可以在上述代码基础上继续使用 groupby() 方法:
```python
# 按照销售地区分组,并计算销售额的和
grouped = grouped.groupby('销售地区').sum()
print(grouped)
```
输出结果为:
```
销售地区
华北 700
华南 1100
华东 300
Name: 销售额, dtype: int64
```
可以看到,按照销售地区进行了进一步的分组,并计算了销售额的和。
阅读全文