如何使用python将已经排好顺序的数据等宽分箱
时间: 2024-05-09 13:20:52 浏览: 83
python的等深分箱实例
3星 · 编辑精心推荐
可以使用pandas的cut函数来将已经排好顺序的数据等宽分箱。
示例代码:
```python
import pandas as pd
# 原始数据
data = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
# 将数据分成3个等宽的箱子
bins = pd.cut(data, 3, retbins=True)[1]
# 将数据分箱
labels = ['bin{}'.format(i+1) for i in range(len(bins)-1)]
result = pd.cut(data, bins=bins, labels=labels)
# 打印结果
print(result)
```
输出结果:
```
[bin1, bin1, bin1, bin2, bin2, bin2, bin3, bin3, bin3, bin3]
Categories (3, object): [bin1 < bin2 < bin3]
```
其中,参数3表示将数据分成3个等宽的箱子,retbins=True表示返回箱子的边界。将返回的边界用作参数bins,labels用于给每个箱子命名。最后,将原始数据传递到cut函数中,将会得到已经分好箱的结果。结果是一个Pandas的Series对象,每个值表示原始数据所属的箱子。
阅读全文