监督学习中的岭回归与Lasso回归解析

需积分: 1 171 浏览量更新于2024-08-04 收藏 263KB PPTX 举报

"这篇文档主要讨论了监督学习中的线性模型，特别是岭回归和Lasso回归，这两种都是解决线性回归问题时引入正则化的技术。文档提到了线性回归的基本概念，包括最小二乘法和残差平方和，以及在特征间存在多重共线性时遇到的问题。接着，它介绍了岭回归的概念，通过添加一个常数λ到XTX矩阵的对角线上以解决不适定问题，并解释了λ如何影响模型复杂度。最后，文档简要提及了Lasso回归，其使用L1范数进行正则化，能够实现特征选择的效果。" 在监督学习中，线性模型是一种广泛应用的预测技术，其中最基础的是线性回归。线性回归基于最小二乘法原理，通过最小化预测值与真实值之间的残差平方和来确定模型参数。然而，当特征之间存在高度相关性（多重共线性）时，标准线性回归可能产生不稳定的系数估计，导致模型过拟合。为解决这一问题，引入了正则化技术。岭回归（Ridge Regression）是线性回归的一种变体，通过在损失函数中加入L2范数惩罚项来克服多重共线性问题。L2范数惩罚项是所有系数向量的平方和的开方，即 ∣∣β∣∣2=∑j=1pβj2，这里的p是特征数量。通过在XTX矩阵的对角线上加上一个常数λ的单位矩阵In，我们得到了调整后的系数估计，这使得即使在XTX不满秩的情况下也能找到解。λ的大小决定了正则化的强度，较大的λ会使系数更小，从而简化模型，降低过拟合的风险。 Lasso回归（Least Absolute Shrinkage and Selection Operator）是另一种正则化的线性回归方法，它使用L1范数作为惩罚项，即 λ∑j=1p|βj|。L1范数的独特之处在于它可以驱动某些系数变为零，从而实现特征选择。这意味着Lasso不仅可以控制模型复杂度，还能帮助我们构建更简洁的模型，只保留对预测有显著影响的特征。弹性网络回归（ElasticNet Regression）是岭回归和Lasso回归的结合，它同时包含L1和L2范数的惩罚项，既保持了模型的稀疏性，又能防止在特征高度相关时Lasso选择特征的不稳定性。弹性网络通过调整L1和L2范数的比例来平衡模型的复杂度和特征选择。这些正则化技术在实际应用中非常有用，例如在高维数据集或特征相关性较强的情况下。通过调整正则化参数，我们可以根据需要在模型的解释性和预测性能之间做出权衡。在选择模型时，通常会使用交叉验证来确定最佳的λ值，确保模型在未见过的数据上表现良好。

1. 线性回归：Linear Regression

 在标准线性回归中，通过最小化真实值和预测值的平方误差来训练模型，这个平方

误差值也被称为残差平方和(RSS, Residual Sum Of Squares):

 最小二乘法即最小化残差平方和，为：

 将其化为矩阵形式：

 求解为：

剩余13页未读，继续阅读

深耕智能驾驶

粉丝: 1590
资源: 26

监督学习中的岭回归与Lasso回归解析

机器学习：线性回归、岭回归与Lasso回归解析

数学建模算法实例：岭回归与LASSO回归详细Matlab代码

岭回归与Lasso模型实现及比较

11-提交-监督学习 - 课程导学.pdf

scikit-learn-0.21.2.tar.gz

43. 岭回归与lasso回归1

PyPI 官网下载 | c_lasso-0.3.0.30.tar.gz

scikit-learn-0.21.1.tar.gz

1-线性模型03.zip

岭回归与LASSO回归模型.rar

最新资源