jupyter notebook双层group by
时间: 2024-03-21 15:36:39 浏览: 10
Jupyter Notebook是一个开源的交互式笔记本,它让你在一个网页界面中编写和运行代码、展示数据分析结果、撰写文档等。双层group by是指在数据分析中对数据进行两次分组操作。
在Jupyter Notebook中,你可以使用Python编程语言来进行双层group by操作。下面是一个示例代码:
```python
import pandas as pd
# 创建一个示例数据集
data = {'Category': ['A', 'A', 'B', 'B', 'A', 'B'],
'Subcategory': ['X', 'Y', 'X', 'Y', 'Z', 'Z'],
'Value': [1, 2, 3, 4, 5, 6]}
= pd.DataFrame(data)
# 第一层group by:按Category分组,并计算每个Category的平均值
grouped_df = df.groupby('Category').mean()
# 第二层group by:在第一层分组的基础上,按Subcategory分组,并计算每个Subcategory的平均值
double_grouped_df = df.groupby(['Category', 'Subcategory']).mean()
# 打印结果
print("第一层group by结果:")
print(grouped_df)
print("\n第二层group by结果:")
print(double_grouped_df)
```
运行以上代码,你将得到如下输出:
```
第一层group by结果:
Value
Category
A 2.67
B 4.33
第二层group by结果:
Value
Category Subcategory
A X 1.0
Y 2.0
Z 5.0
B X 3.0
Y 4.0
Z 6.0
```