分别用梯度下降算法实现Logistic回归的L1正则化和L2正则化

对于Logistic回归的L1正则化，损失函数为： J(w) = -1/m * [sum(yi*log(h(xi)) + (1-yi)*log(1-h(xi))) + lambda * sum(abs(w))] 其中，yi是第i个样本的标签，h(xi)是该样本的预测概率，w是模型参数，lambda是正则化系数。可以使用梯度下降算法更新参数： w_j = w_j - alpha * (1/m * sum((h(xi)-yi)*xi_j) + lambda * sign(w_j)) 其中，alpha是学习率，sign(w_j)是w_j的符号函数，即当w_j>0时为1，w_j<0时为-1，w_j=0时为0。对于Logistic回归的L2正则化，损失函数为： J(w) = -1/m * [sum(yi*log(h(xi)) + (1-yi)*log(1-h(xi))) + lambda/2 * sum(w^2)] 其中，yi是第i个样本的标签，h(xi)是该样本的预测概率，w是模型参数，lambda是正则化系数。可以使用梯度下降算法更新参数： w_j = w_j - alpha * (1/m * sum((h(xi)-yi)*xi_j) + lambda * w_j) 其中，alpha是学习率。注意，L2正则化中的正则化项是w的平方和，而不是绝对值和。下面是使用Python实现Logistic回归的L1正则化和L2正则化的代码： ```python import numpy as np class LogisticRegression: def __init__(self, lr=0.1, num_iter=1000, fit_intercept=True, regularization=None, lambda_=0.1): self.lr = lr self.num_iter = num_iter self.fit_intercept = fit_intercept self.regularization = regularization self.lambda_ = lambda_ def __add_intercept(self, X): intercept = np.ones((X.shape[0], 1)) return np.concatenate((intercept, X), axis=1) def __sigmoid(self, z): return 1 / (1 + np.exp(-z)) def __loss(self, h, y): return (-y * np.log(h) - (1 - y) * np.log(1 - h)).mean() def __l1_regularization(self, w): return self.lambda_ * np.abs(w[1:]).sum() def __l2_regularization(self, w): return self.lambda_ * np.sum(w[1:] ** 2) def fit(self, X, y): if self.fit_intercept: X = self.__add_intercept(X) self.theta = np.zeros(X.shape[1]) for i in range(self.num_iter): z = np.dot(X, self.theta) h = self.__sigmoid(z) if self.regularization == 'l1': # L1正则化 grad = np.dot(X.T, (h - y)) / y.size + self.lambda_ * np.sign(self.theta) elif self.regularization == 'l2': # L2正则化 grad = np.dot(X.T, (h - y)) / y.size + self.lambda_ * self.theta else: grad = np.dot(X.T, (h - y)) / y.size self.theta -= self.lr * grad def predict_prob(self, X): if self.fit_intercept: X = self.__add_intercept(X) return self.__sigmoid(np.dot(X, self.theta)) def predict(self, X, threshold=0.5): return self.predict_prob(X) >= threshold ``` 其中，lr是学习率，num_iter是迭代次数，fit_intercept表示是否拟合截距，regularization表示正则化方法，lambda_是正则化系数。在fit方法中，通过判断regularization的取值，来实现L1正则化和L2正则化。在L1正则化中，使用np.sign函数计算符号函数，而在L2正则化中，直接对参数的平方和进行惩罚。在predict_prob方法中，对X进行截距拟合和sigmoid变换，返回预测概率。在predict方法中，对预测概率进行阈值处理，返回预测结果。

阅读全文

分别用梯度下降算法实现Logistic回归的L1正则化和L2正则化

相关推荐

梯度下降算法线性回归数据

逻辑回归L2正则化预测模型

LogisticRegression:(c++) 多元逻辑斯蒂回归，并实现随机梯度下降和L1L2正则化项

用梯度下降算法实现Logistic回归的L1正则化和L2正则化

用梯度下降算法实现Logistic回归的L1正则化和L2正则化python代码

logistic回归算法时一个经验损失最小化算法。因此，可以对其进行正则化，轻描诉logistic回归算法的L1正则化与L2正则化算法的目标函数，并用梯度下降算法实现logistic回归算法的L1正则化与L2正则化。写出代码

机器学习__Logistic回归的正则化.pptx

Face-detection:该任务的目的是用训练算法实现逻辑回归模型，以用于照片中的人脸检测任务。使用模型训练，梯度算法，随机简单梯度算法，正则化，模型选择，操作正确性测试

Logistic 回归梯度下降法和牛顿法的 Python 实现.zip

C++实现多元逻辑斯蒂回归及其L1/L2正则化

常见的正则化技术：L1正则化

logistic回归模型与正则化技术的结合应用

【进阶】正则化方法：L1与L2正则化

逻辑回归的正则化技术

L1正则化终极指南：掌握其在机器学习中的核心价值与应用（专家解读+代码实现）

【L1正则化的统计学基础】：掌握惩罚项对系数影响的秘密（理论深入+实践指导）

L2正则化算法实践：参数平滑化与泛化能力

使用jupyter notebook实现多元逻辑回归问题，利用梯度下降法（批量梯度，随机梯度），特征缩放，正则项（L1和L2正则）与回归模型评估，minist数据集代码

在Python中，使用scikit-learn库的LogisticRegression类来实现逻辑回归模型。该类提供了多种参数估计算法，例如使用liblinear库实现的梯度下降法和牛顿法，以及使用lbfgs和sag库实现的拟牛顿法等。

最新推荐

基于纯verilogFPGA的双线性差值视频缩放 功能：利用双线性差值算法，pc端HDMI输入视频缩小或放大，然后再通过HDMI输出显示，可以任意缩放 缩放模块仅含有ddr ip，手写了 ram,f

【java毕业设计】智慧社区智慧社区管理员密码修改与重置系统（源代码+论文+PPT模板）.zip

基于51单片机的一个智能密码锁设计.7z

《STM32单片机+2x180-SG90+2x360-SG90+OLED屏幕》源代码

JavaScript实现的高效pomodoro时钟教程

管理建模和仿真的文件

【WebLogic客户端兼容性提升秘籍】：一站式解决方案与实战案例

使用jupyter读取文件“近5年考试人数.csv”，绘制近5年高考及考研人数发展趋势图，数据如下（单位：万人）。

CMake 3.25.3版本发布：程序员必备构建工具

"互动学习：行动中的多样性与论文攻读经历"

基于纯verilogFPGA的双线性差值视频缩放功能：利用双线性差值算法，pc端HDMI输入视频缩小或放大，然后再通过HDMI输出显示，可以任意缩放缩放模块仅含有ddr ip，手写了 ram,f