python怎么实现连续变量离散化
时间: 2023-06-02 12:04:43 浏览: 210
可以使用 pandas 库中的 cut 或 qcut 函数进行连续变量的离散化。cut 对数据进行等距离切片,qcut 对数据进行等频率切片,可以根据数据的分布情况来选择使用哪种方式。可以使用下面的代码实现:
```
import pandas as pd
# 构造数据
data = pd.DataFrame({'age': [22, 34, 55, 67, 28, 45, 34, 56, 46, 32]})
# 使用 cut 函数进行等距切片
data['age_group'] = pd.cut(data['age'], 3, labels=['young', 'middle', 'old'])
# 使用 qcut 函数进行等频切片
data['age_group'] = pd.qcut(data['age'], 3, labels=['young', 'middle', 'old'])
```
以上代码中,参数 3 表示将数据分为 3 组,labels 指定了各组对应的标签。可以根据实际需求来调整分组数和标签。
阅读全文