决策树与信息增益：人工智能理论作业示例

需积分: 0 64 浏览量更新于2024-08-05 收藏 272KB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

在本篇人工智能理论作业4中，学生邝金熙探讨了决策树作为机器学习算法的基础概念。首先，他通过计算整个数据集的信息熵来理解数据集的不确定性。对于18个样本，由于skips和reads各占一半，初始信息熵H0为1。接下来，邝金熙考虑了几个特征对分类的影响力： 1. 作者是否有名：根据提供的数据，有名作者的书籍样本中有12个skips和6个reads，信息增益Gain0A为0，因为分裂后每个子集的信息熵保持不变。 2. 书是新作还是续作、书的篇幅长短、阅读场所：对于这些特征，信息增益分别为Gain0B=0.1498，Gain0C=0.5819，和Gain0D=0，其中篇幅长短的特征带来的增益最大，成为划分的第一个关键因素。在选择篇幅长短这个特征后，将数据集划分为两个子集：一个包含7个篇幅长且全部为skips的样本，另一个包含9个样本，进一步分析阅读场所的信息。具体到篇幅短的子集，子节点中有2个skips和7个reads，信息熵为H1和对应的Gain1A，但由于内容未给出，这部分的详细计算和信息增益未能展示。决策树构建过程中，信息增益被用来评估每个特征的重要性，选择增益最大的特征作为当前节点的分裂依据。直到所有特征的增益为零或者达到预定的停止条件（如达到最大深度、最小样本数等），决策树的构造才会停止。在这个过程中，朴素贝叶斯分类法可能会被提及作为一种简单而有效的概率模型，它假设特征之间相互独立，用于估计各个类别的概率。同时，异或神经网络（XOR）在这里可能不是直接讨论的主题，但它通常与逻辑门操作和多层神经网络结构相关，用于处理非线性问题，这可能与决策树中的特征选择和模型复杂度提升形成对比。至于计算损失函数对权重的偏导数，这通常涉及到深度学习的梯度下降优化过程，可能与优化神经网络参数的学习算法有关。本作业展示了决策树的基本原理、信息增益的选择以及可能涉及的概率模型和优化技术，这些都是人工智能领域的重要知识点。

资源详情

资源推荐

人工智能理论作业 4 18340082 邝金熙

人工智能理论作业 4

数据科学与计算机学院

18340082 邝金熙

1. 决策树

首先计算整个数据集的信息熵：一共有 18 个样本，分类为 skips 的有 9 个，为 reads 的有 9

个，概率均为 0.5. 故 H

= −(

log

) = 1.

若根据作者是否有名进行分类，则可计数得 18 个样本中有 12 个作者有名，6 个作者不出名；

12 个作者有名的样本中 3 个为 skips,6 个为 reads；6 个作者有名的样本中 3 个为 skips,3 个为

reads；从而可以计算对作者是否有名进行分裂之后的信息增益：

Gain

= H

− H

= H

− (

(−(

log

)) +

(−(

log

)))

= 0

同理根据该书是新作还是续作、该书的篇幅长短、该书的阅读场所是在家还是工作地，依次

计算其信息增益可以得到：

Gain

= H

− H

= H

− (

(−(

log

)) +

(−(

log

)))

= 0.1498258895566673

Gain

= H

− H

= H

− (

(−(

log

)) +

(−(

log

)))

= 0.581968199340573

Gain

= H

− H

= H

− (

(−(

log

)) +

(−(

log

)))

= 0

下载后可阅读完整内容，剩余8页未读，立即下载

琉璃纱

粉丝: 17
资源: 298

决策树与信息增益：人工智能理论作业示例

18340082-邝金熙1

高威科MES事业部--邝继双--上海_MES执行制造方案.pdf

hash表c语言链地址法

JooqAutoConfiguration

thinkphp 使用medoo

easyexcel导出数据过多

ListView 中的item随意拖动.zip

Todo应用-基于MySQL和Hibernate实现.zip

开家可乐店bcm4文件

阳光酒店管理系统(javaapplet+SQL).zip

java基于SpringBoot+vue 校园新闻管理系统源码 带毕业论文

ssm+mysql的中学教务管理系统（源码+lw+ppt）

想要快速查看Gif内容？我们的工具支持即时预览，无需等待加载完成即可查看Gif全貌

weixin175基于微信平台的文玩销售小程序ssm.rar

基于springboot的时间管理系统设计与实现.docx

Sigrity-SystemExplorer-template.rar

weixin244教育培训微信小程序ssm.rar

基于springboot的地方美食分享网站设计与实现.docx

MATLAB的火焰检测定位系统GUI设计.zip

java基于SpringBoot+vue 新冠物资管理系统源码 带毕业论文

最新资源

java基于SpringBoot+vue 校园新闻管理系统源码带毕业论文

java基于SpringBoot+vue 新冠物资管理系统源码带毕业论文