决策树纯度增益计算公式
时间: 2023-11-27 18:46:23 浏览: 87
决策树算法代码
决策树纯度增益计算公式如下:
$Gain(D, a) = Ent(D) - \sum_{v=1}^{V}\frac{|D^v|}{|D|}Ent(D^v)$
其中,$D$表示数据集,$a$表示某个属性,$V$表示属性$a$的取值个数,$D^v$表示$D$中在属性$a$上取值为$v$的子集,$Ent(D)$表示数据集$D$的信息熵,$Ent(D)=-\sum_{k=1}^{|\mathcal{Y}|}p_k\log_2p_k$,$p_k$表示数据集$D$中第$k$类样本所占的比例。
阅读全文