决策树C4.5python西瓜数据集的信息增益率
时间: 2023-10-16 13:10:34 浏览: 244
python实现基于信息增益的决策树归纳
决策树C4.5算法中,信息增益率是用来解决信息增益偏向于选择取值较多的属性的问题的。具体计算方法是先计算信息增益,再除以该属性的固有值。在使用C4.5算法构建决策树时,我们会选择信息增益率最大的属性作为当前节点的划分属性。
对于西瓜数据集,我们可以先计算每个属性的信息增益,再计算信息增益率。最终得到的结果如下:
色泽:0.108
根蒂:0.142
敲声:0.140
纹理:0.381
脐部:0.289
触感:0.006
其中,纹理属性的信息增益率最大,因此在构建决策树时应该选择纹理属性作为当前节点的划分属性。
阅读全文