机器学习：Ridge、LASSO与ElasticNet回归的详解及其惩罚策略

版权申诉

5星 · 超过95%的资源 190 浏览量更新于2024-09-11 收藏 205KB PDF 举报

在机器学习领域，回归分析是预测连续变量的重要工具，特别是在处理大量特征和可能存在的过拟合问题时。三种常用的回归方法——Ridge、LASSO和ElasticNet，通过引入正则化技术来增强模型的泛化能力。正则化旨在通过在损失函数中添加对模型复杂度的惩罚项，防止过度依赖训练数据中的噪声。 1. **Ridge Regression (L2 Regulation)** - L2正则化，也称为岭回归，通过添加参数的平方和作为惩罚项，使得较小的参数值被鼓励。公式上，L2范数（||w||_2^2）会使得权重向量w中的所有元素都趋向于零，但不会完全置零。这种平滑的惩罚有助于减少过拟合，同时保持模型的线性关系。 2. **LASSO Regression (L1 Regulation)** - L1正则化，或LASSO（Least Absolute Shrinkage and Selection Operator），相比于L2，它对权重向量施加的是绝对值的惩罚。这意味着一些权重可能会被完全置零，从而实现特征选择的功能，即自动筛选出对预测最有影响的特征，适用于高维数据集中的特征降维。 3. **ElasticNet Regression (L2 & L1 Regulation)** - ElasticNet结合了L1和L2正则化的优点，既具有LASSO的特征选择特性，又保留了Ridge的平滑性。它通过一个混合参数α控制正则化的方式，当α接近1时，更倾向于LASSO；当α接近0时，接近Ridge。这使得ElasticNet在保持模型简洁的同时，能适应不同情况下的复杂性需求。在评估回归模型性能时，通常使用两种量化指标： - **Mean Square Error (MSE)**：衡量预测值与真实值之间的平均平方误差，反映模型的整体拟合效果。 - **R2 Score (标准版本的MSE)**：也称为决定系数，范围在0到1之间，值越高表示模型解释数据变异性的能力越强，1表示完美拟合。使用Python的Scikit-learn库进行这些回归模型的实现，例如加载数据集、分割数据为训练集和测试集、实例化相应的模型（如`LinearRegression`）、训练模型并计算预测结果，最后评估模型性能时会用到`mean_squared_error`和`r2_score`函数。理解并掌握Ridge、LASSO和ElasticNet回归模型，能够帮助你在实际项目中根据数据特性和问题需求选择合适的正则化策略，提高模型的稳定性和预测准确性。

机器学习机器学习-三种回归方法（三种回归方法（Ridge、、LASSO和和ElasticNet回归）回归）

Section I: Brief Introduction on Three Regression Models

Regulation is one approach to tackle the problem of overfitting by adding additional information, and thereby shrinking the parameter values of the model to induce a penalty

against complexity. The most popular approaches to regularized linear regression are the so-called Ridge Regression, Least Absolute Shrinkage and Selection

Operator(LASSO), AND Elastic Net Models.

Ridge Regression: L2 Regulation

LASSO Regression: L1 Regulation

ElasticNet Regression: L2 and L1 Regulation

Two Quantitative Measures

Mean Square Error(MSE)

R2 Score – Standard Version of MSE

FROM

Sebastian Raschka, Vahid Mirjalili. Python机器学习第二版. 南京：东南大学出版社，2018.

第一部分：第一部分：Ridge Regression

代码代码

from sklearn import datasets

from sklearn.model_selection import train_test_split

from sklearn.linear_model import LinearRegression

from sklearn.metrics import mean_squared_error,r2_score

import matplotlib.pyplot as plt

import warnings

warnings.filterwarnings("ignore")

plt.rcParams['figure.dpi']=200

plt.rcParams['savefig.dpi']=200

font = {'family': 'Times New Roman',

'weight': 'light'}

plt.rc("font", **font)

#Section 1: Load data and split it into Train/Test dataset

price=datasets.load_boston()

X=price.data

y=price.target

X_train,X_test,y_train,y_test=train_test_split(X,y,

test_size=0.3)

#Section 2: Ridge Regression and Least Shrinkage and Selection Operator(LASSO) AND Elastic Net

#Ridge: L2 Regulation

#LASSO: L1 Regulation

#Elastic Net: Both L1 and L2 Regulation

#Section 2.1: Ridge Model

#The parameter alpha would be the regulation stength.

from sklearn.linear_model import Ridge

ridge=Ridge(alpha=1.0)

ridge.fit(X_train,y_train)

y_train_pred=ridge.predict(X_train)

y_test_pred=ridge.predict(X_test)

plt.scatter(y_train_pred,y_train_pred-y_train,

c='blue',marker='o',edgecolor='white',

label='Training Data')

plt.scatter(y_test_pred,y_test_pred-y_test,

c='limegreen',marker='s',edgecolors='white',

label='Test Data')

plt.xlabel("Predicted Values")

plt.ylabel("The Residuals")

plt.legend(loc='upper left')

plt.hlines(y=0,xmin=-10,xmax=50,color='black',lw=2)

plt.xlim([-10,50])

plt.title("Ridge Regression Model")

plt.savefig('./fig2.png')

plt.show()

print("MSE Train in Ridge: %.3f, Test: %.3f" % \

(mean_squared_error(y_train,y_train_pred),

mean_squared_error(y_test,y_test_pred)))

print("R^2 Train in Ridge: %.3f, Test: %.3f" % \

(r2_score(y_train,y_train_pred),

r2_score(y_test,y_test_pred)))

结果结果

下载后可阅读完整内容，剩余4页未读，立即下载

weixin_38693657

粉丝: 0
资源: 926

机器学习：Ridge、LASSO与ElasticNet回归的详解及其惩罚策略

matlabauc代码-elasticnet:交叉验证和自举的弹性净罚分回归

elasticNet_弹性网络回归_elastcicNet_回归网络_elasticnet_prettyjj1_

岭回归 LASSO回归 （python 实现）

机器学习算法ridge回归

常用于回归的机器学习算法

介绍一下scikit-learnde用法，尤其是线性回归、岭回归以及Lasso回归的使用场景和有略点，并举出具体的例

r语言lasso-logistic回归

机器学习线性回归实验

pycaret包含哪些机器学习模型，调用时名称是什么

用机器学习的正则化算法建立一个模型

最新资源

岭回归 LASSO回归（python 实现）