斯坦福机器学习课笔记：局部加权回归与过拟合解析

需积分: 0 174 浏览量更新于2024-08-05 收藏 354KB PDF 举报

"这篇笔记涵盖了斯坦福机器学习公开课的第31讲，主要涉及局部加权回归、最小二乘法的概率解释、逻辑斯蒂回归和感知器算法。内容包括过拟合与欠拟合的概念、参数学习与非参数学习算法的定义以及线性回归在不同情况下的应用。" 在机器学习领域，过拟合和欠拟合是评估模型性能的两个关键概念。过拟合指的是模型在训练数据上表现良好，但在未见过的数据上表现差劲，这是因为模型过度依赖训练数据中的噪声或细节。相反，欠拟合则表示模型未能捕捉到数据中的重要模式，导致预测能力不足。例如，一个简单的线性模型可能对复杂的数据集产生欠拟合，而一个复杂的高阶多项式模型可能对简单数据集产生过拟合。最小二乘法是一种广泛用于线性回归的参数学习算法，其目标是最小化预测值与实际值之间的误差平方和。在这个笔记中，它还被赋予了一个概率解释，即通过最大化似然估计来找到最佳参数。最小二乘法适用于目标变量与输入特征之间存在线性关系的情况。局部加权回归（LWR，也称为LOESS）是一种非参数学习方法，用于处理非线性问题。它通过赋予每个训练样本不同的权重来改进线性回归，这些权重通常基于样本点与预测点的距离。距离更近的样本在预测中起更大的作用，从而允许模型更好地适应局部数据结构。LWR的目标函数是加权的最小二乘，即只考虑与预测点相邻的样本进行回归，减少了过拟合的风险。逻辑斯蒂回归（Logistic Regression）是一种分类算法，它使用类似于线性回归的模型，但将连续的预测值转换为概率，适用于二分类问题。逻辑斯蒂回归通过sigmoid函数将线性组合映射到(0,1)区间，形成概率预测。感知器算法是另一种机器学习算法，主要用于解决线性可分的二分类问题。它以迭代的方式更新权重，试图找到一个超平面，将不同类别的样本分开。在每次迭代中，如果一个样本被错误分类，权重就会相应调整，直到所有训练样本都被正确分类或达到预设的迭代次数。这些笔记内容涵盖了回归分析的关键方面，包括模型选择、过拟合和欠拟合的理解、以及参数与非参数学习算法的应用。理解这些概念和技术对于提升机器学习模型的性能至关重要。

http://weibo.com/yanxiangzhang http://blog.csdn.net/stdcoutzyx

斯坦福 ML 公开课笔记 3

这篇笔记针对公开课的第三个视频，主要内容包括局部加权回归（LWR，

Locally/Loess Weighted Regression）、最小二乘法的概率解释、逻辑斯蒂回归

（logistic regression）、感知器算法。

首先，Ng 分析了过拟合与欠拟合的概念。举了三个例子，第一个例子还是

房价-大小，即用大小这一个变量构建一个线性回归模型来拟合房价，第二个例

子是房价-大小/大小的平方，即用两个变量构建一个线性回归模型来拟合房价，

尽管第二个变量与第一个变量呈平方关系，但这样或许会拟合的更好；第三个例

子是对于一个有七个样例的房价-大小关系，用六次多项式对其进行建模来拟合

房价。显然，若第二个例子的方法比第一个例子要好的话，那么第一个例子就是

欠拟合（underfitting），第三个例子是过拟合（overfitting）。

过拟合的形式化定义在《ML》

中这样给出：给定一个假设空间 H，一个假

设 h 属于 H，如果存在其他的假设 h

，使得在训练样例上 h 的错误率比 h

好，

但在整个实例分布上 h

的错误率比 h 小，那么就说假设 h 是过拟合。欠拟合的

定义与之相似。

然后，给出了参数学习算法（Parametric Learning Method）和非参数学习算

法（Non-Parametric Learning Method）的定义。参数学习算法是一类有固定数目

参数的用来进行数据拟合的算法，线性回归即是此类。非参数学习算法则是一类

参数数目随数据集增大而变多（一般是线性增大）的算法，接下来要讨论的局部

加权回归即是此类。

局部加权回归

局部加权回归算法是对线性回归的扩展，当目标假设是线性模型时，使用线

性回归自然能拟合的很好，但如果目标假设不是线性模型，比如一个忽上忽下的

的函数，这时用线性模型就拟合的很差。为了解决这个问题，当我们在预测一个

点的值时，我们选择和这个点相近的点而不是全部的点做线性回归。基于这个思

想，就有了局部加权回归算法，它的目标函数是加权的最小二乘：



󰇛



󰇜



󰇛󰇜

󰇛

󰇛



󰇜







󰇛󰇜

󰇜





(1)

Tom Mitchell 著

下载后可阅读完整内容，剩余4页未读，立即下载

yxldr

粉丝: 22
资源: 326

斯坦福机器学习课笔记：局部加权回归与过拟合解析

斯坦福ML公开课笔记_中文版

斯坦福ML公开课笔记71

斯坦福ML公开课笔记111

斯坦福ML公开课笔记121

斯坦福ML公开课笔记141

斯坦福ML公开课笔记81

斯坦福ML公开课笔记91

斯坦福ML公开课笔记61

斯坦福ML公开课笔记13B1

斯坦福ML公开课笔记13A1

最新资源