pandas cut
时间: 2023-11-09 18:03:23 浏览: 101
浅谈pandas.cut与pandas.qcut的使用方法及区别
5星 · 资源好评率100%
pandas.cut() 是 pandas 库中的一个函数,用于将一组数据按照指定的区间进行分组,并将每个数据所属的组别作为新的一列返回。
例如,我们有一组年龄数据,我们想将其分为三个年龄段:18岁以下、18-30岁、30岁以上。可以使用 pandas.cut() 函数来实现:
```python
import pandas as pd
ages = [16, 21, 25, 30, 35, 40, 45, 50]
bins = [0, 18, 30, 100]
labels = ['18岁以下', '18-30岁', '30岁以上']
age_cut = pd.cut(ages, bins=bins, labels=labels)
print(age_cut)
```
输出结果为:
```
[18岁以下, 18-30岁, 18-30岁, 18-30岁, 30岁以上, 30岁以上, 30岁以上, 30岁以上]
Categories (3, object): [18岁以下 < 18-30岁 < 30岁以上]
```
可以看到,原来的年龄数据被分为了三个年龄段,并且每个数据所属的年龄段被作为新的一列返回。
阅读全文