决策树学习详解：分类与构建原理

需积分: 0 160 浏览量更新于2024-08-05 收藏 1.11MB PDF 举报

"决策树是一种基于树状结构进行分类和回归的机器学习算法，常用于数据分析和预测建模。它的模型由节点和有向边构成，其中内部节点代表特征或属性，叶子节点代表最终的分类结果。在分类过程中，决策树通过自顶向下地对样本进行特征测试，按照测试结果将样本分配到相应的子节点，直至达到叶子节点，从而完成分类。此过程形成了互斥且完备的分类路径。决策树学习主要包括特征选择、决策树生成和决策树剪枝三个步骤。决策树的优点在于其模型直观易懂，便于解释，同时分类效率高。在特征选择阶段，算法会选择最具区分度的特征来划分数据；决策树生成时，算法会递归地将数据集分割成更小的部分，直到满足停止条件，如达到预设的最小叶子节点数或所有样本属于同一类别等。决策树剪枝则是为了防止过拟合，通过牺牲一定的泛化能力来提高模型的稳定性和泛化性能。损失函数最小化是决策树优化的主要策略，通常采用正则化的极大似然估计。然而，寻找最优决策树是一个NP完全问题，因此实践中多采用启发式算法，如ID3、C4.5、CART等，它们可以生成近似的次优决策树。这些算法在每次分裂时选择最优特征，依据信息增益、基尼不纯度或其他相似度度量标准。在实际应用中，决策树可以单独使用，也可以作为集成学习方法的一部分，如随机森林和梯度提升机。随机森林通过构建多个决策树并取多数投票或平均预测结果来提高模型的准确性和鲁棒性，而梯度提升机则逐步迭代地添加决策树，每棵树专注于纠正前一棵树的错误，从而实现整体性能的提升。决策树是一种强大的工具，适用于多种类型的数据和任务，尤其适合处理具有离散特征的分类问题。通过理解和掌握决策树的基本原理和算法，可以有效地解决许多实际问题，并为后续的深度学习和复杂模型提供基础。"

2022/4/27 4_decision_tree

huaxiaozhuan.com/统计学习/chapters/4_decision_tree.html 3/14

定义数据集

关于特征

的经验条件熵为：

其中：

属性

且类别为

的样本的数量为

，所有样本的总数为

。

因此有：

。

是条件熵

的估计。它刻画了数据集

中，属性

中的那

些样本中的类别的分布情况。

是条件熵

的估计。

2.1

信息增益

特征

对训练数据集

的信息增益

定义为：集合

的经验熵

与关于特征

经验条件熵

之差。即：

。

由于熵

也称作互信息，因此信息增益也等于训练数据集中类与特征的互信息。

决策树学习可以应用信息增益来选择特征。给定训练集

和特征

：

经验熵

刻画了对数据集

进行分类的不确定性。

经验条件熵

刻画了在特征

给定条件下，对数据集

分类的不确定性。

信息增益

刻画了由于特征

的确定，从而使得对数据集

的分类的不确定性减少

的程度。

不同的特征往往具有不同的信息增益。

信息增益大的特征具有更强的分类能力

。

如果一个特征的信息增益为

，则表示该特征没有什么分类能力。

2.2

信息增益比

以信息增益作为划分训练集的特征选取方案，存在偏向于选取值较多的特征的问题。

公式

中：

当极限情况下

，特征

在每个样本上的取值都不同，即

。

此时特征

将每一个样本都划分到不同的子结点。即：

。

由于

，因此有：

。

即：

取值为

或者

。因此有：

。

最终使得

。

条件熵的最小值为

，这意味着该情况下的信息增益达到了最大值。

然而很显然这个特征

显然不是最佳选择，因为它并不具有任何分类能力。

可以通过定义信息增益比来解决该问题。

特征

对训练集

的信息增益比

定义为：信息增益

与关于特征

的熵

之比：

剩余13页未读，继续阅读

Crazyanti

粉丝: 26
资源: 302

决策树学习详解：分类与构建原理

3.决策树决策树决策树.rar

【中秋特别学习资源】第二阶段：机器学习经典算法-02决策树与随机森林-3.决策树构造实例

任务8： 1. 决策树.zip_Python__Python_

.决策树进行文本分类

04.决策树DTC数据分析及鸢尾数据集分析1

C4_5.zip_决策树_决策树c4.5_决策树分类_决策树算法c4.5_规则决策树

mo_4.mAdaBoost决策树实现人脸人脸matlab源码

最新资源