机器学习入门：显著式编程与非显著编程的理解

需积分: 3 6 浏览量更新于2024-08-03 收藏 1.04MB PDF 举报

"机器学习复习提纲，涵盖了显著式编程与非显著式编程的概念，机器学习的定义，以及监督学习、非监督学习、半监督学习和强化学习的应用。此外，提纲还涉及到k近邻算法的原理、步骤、k值选择的影响、优缺点，以及k折交叉验证法。最后提到了决策树分类模型的基本思路和信息熵的定义及应用。" 机器学习是人工智能领域的核心研究方向，它主要关注如何通过数据和经验提升计算机算法的性能。显著式编程是一种传统编程方式，要求程序员详尽地定义环境和规则，而非显著式编程则允许计算机通过设定行为、收益函数，通过自我学习和优化来实现任务。在机器学习中，我们通常会遇到四种主要的学习类型：监督学习（有标签数据）、非监督学习（无标签数据）、半监督学习（少量标签数据）和强化学习（基于环境反馈的学习）。 k近邻算法（K-Nearest Neighbors, KNN）是一种简单的分类和回归方法。其基本思想是：新样本会根据其最近的k个训练样本的类别进行分类，多数类别决定新样本的归属。k值的选择至关重要，它直接影响分类效果。较小的k值可能导致过拟合，较大的k值可能会引入噪声，但计算成本也会增加。k折交叉验证法用于评估模型的性能，通过将数据集分成k个子集，依次作为测试集，其余作为训练集，平均各个测试结果，提高模型泛化能力。决策树是一种直观的分类模型，通过选择最佳特征进行数据划分，形成树状结构。构造决策树时，通常依据信息熵或基尼不纯度等指标寻找最佳划分特征。信息熵衡量数据集的纯度，越低表示数据集分类越明确。在决策树构建过程中，降低信息熵或基尼不纯度是目标，直至满足预设的停止条件，如达到预设深度或所有叶子节点都达到纯度标准。机器学习涉及了多种方法和技术，从基础的k近邻算法到更复杂的决策树模型，它们都是为了使计算机通过学习和理解数据，提升预测和决策的准确性。掌握这些概念和方法，对于理解和应用机器学习技术至关重要。

①根据某种分类规则得到最优的划分特征，计算最优特征子函数，并创建特征的划分节点，按照

划分节点将数据集划分为若干部分子数据集

②在子数据集上重复使用判别规则，构建出新的节点，作为树的新分支

③重复递归执行，直到满足递归终止条件

1. 信息熵的定义、用途、计算公式

3、信息增益、增益率、基尼指数的定义、特点、计算公式、分别对应的哪个决策树算法

4、具体计算例子

第四章朴素贝叶斯

1、贝叶斯决策与构造贝叶斯分类器的方法

2、朴素贝叶斯模型的假设与基本思想，对应的公式表示

3、结合 ppt 例题与作业复习朴素贝叶斯分类的计算

4、朴素贝叶斯分类器优缺点

剩余11页未读，继续阅读

Blossomi

粉丝: 3w+
资源: 93

机器学习入门：显著式编程与非显著编程的理解

编译原理复习编译原理复习提纲

C# 课程复习提纲.ppt

嵌入式系统复习提纲

大数据复习提纲.docx

C语言复习提纲.doc

信息系统复习提纲 考试有用

C语言程序设计复习提纲.doc

教育技术学导论复习提纲.doc

人机交互_复习资料

信息检索提纲精要：搜索与推荐关键技术

最新资源

信息系统复习提纲考试有用