在决策树建立过程中,使用一个属性对某个节点对应的数据集合进行划分后,结果具有高信息熵(high entropy),对于结果的描述,最贴切的是( ) A 纯度高 B 有用 C 纯度低 D 无用
时间: 2024-03-31 14:36:24 浏览: 117
基于信息熵的决策树算法实现.docx
C 纯度低。信息熵是用于衡量数据集合纯度的指标,其值越高,数据集合纯度越低。在决策树建立过程中,我们希望通过选择最佳属性进行划分,使得划分后得到的子集的信息熵最小,也就是纯度最高。因此,如果使用一个属性对某个节点对应的数据集合进行划分后,结果具有高信息熵,说明该属性的划分效果不好,数据集合的纯度较低。
阅读全文