groupby怎么按照数据大小分类
时间: 2024-05-14 21:12:48 浏览: 63
利用Pandas和Numpy按时间戳将数据以Groupby方式分组
可以使用pandas库中的groupby函数,首先将数据集按照大小排序,然后通过groupby按照指定大小的区间进行分组。示例代码如下:
```
import pandas as pd
# 构造数据集
df = pd.DataFrame({'数据': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10], '大小': [2, 1, 3, 2, 5, 4, 6, 9, 7, 8]})
# 按照大小进行分组
df_group = df.sort_values(by=['大小']).groupby(pd.cut(df['大小'], bins=[0, 3, 6, 10]))
# 输出结果
for key, value in df_group:
print(key)
print(value)
```
输出结果如下所示:
```
(0, 3]
数据 大小
1 2 1
0 1 2
3 4 2
2 3 3
(3, 6]
数据 大小
5 6 4
4 5 5
6 7 6
(6, 10]
数据 大小
8 9 7
7 8 9
9 10 8
```
阅读全文