修改为逻辑回归的代价函数：def compute_cost(X, y, w, b, lambda_=1): m = X.shape[0] y_hat = np.dot(X, w) + b cost = np.sum((y_hat - y) ** 2) / (2 * m) + lambda_ / (2 * m) * np.sum(w ** 2) return cost

逻辑回归的代价函数如下所示： $$ J(w,b)=-\frac{1}{m}\sum_{i=1}^{m}\left[y^{(i)}\log\left(h_{w,b}(x^{(i)})\right)+\left(1-y^{(i)}\right)\log\left(1-h_{w,b}(x^{(i)})\right)\right]+\frac{\lambda}{2m}\sum_{j=1}^{n}w_j^2 $$ 其中，$m$ 表示样本数量，$n$ 表示特征数量，$y^{(i)}$ 表示第 $i$ 个样本的标签，$h_{w,b}(x^{(i)})$ 是模型对第 $i$ 个样本的预测结果，$\lambda$ 是正则化超参数。对应的 Python 代码如下： ```python def compute_cost(X, y, w, b, lambda_=1): m = X.shape[0] y_hat = sigmoid(np.dot(X, w) + b) cost = -np.sum(y * np.log(y_hat) + (1 - y) * np.log(1 - y_hat)) / m + lambda_ / (2 * m) * np.sum(w ** 2) return cost ``` 其中，`sigmoid` 函数可以用以下代码实现： ```python def sigmoid(z): return 1 / (1 + np.exp(-z)) ```

解释每行代码：def gradient_descent(X, y, w_in, b_in, cost_function, gradient_function, alpha, num_iters, lambda_): m = len(X) J_history = [] w_history = [] for i in range(num_iters): dj_db, dj_dw = compute_gradient(X, y, w_in, b_in) w_in = w_in - alpha * dj_dw b_in = b_in - alpha * dj_db if i<100000: cost = compute_cost(X, y, w_in, b_in, lambda_) J_history.append(cost) if i% math.ceil(num_iters/10) == 0 or i == (num_iters-1): w_history.append(w_in) return w_in, b_in, J_history, w_history np.random.seed(1) intial_w = 0.01 * (np.random.rand(2).reshape(-1,1) - 0.5) initial_b = -8 iterations = 10000 alpha = 0.001 w,b, J_history,_ = gradient_descent(X_train ,y_train, initial_w, initial_b, compute_cost, compute_gradient, alpha, iterations, 0) plot_decision_boundary(w, b, X_train, y_train)

这段代码定义了一个梯度下降函数 gradient_descent，其输入参数包括训练数据 X、标签 y、权重 w_in、偏置 b_in、损失函数 cost_function、梯度函数 gradient_function、学习率 alpha、迭代次数 num_iters 和正则化参数 lambda_。函数的目的是通过梯度下降算法来优化模型的参数，使得模型的损失函数最小化。在函数内部，首先获取训练数据的样本数量 m，并定义两个空列表 J_history 和 w_history 用于存储每次迭代后的损失函数值和权重值。然后使用循环进行迭代，其中每次迭代都会计算当前的梯度，并根据梯度和学习率更新权重和偏置。在迭代过程中，如果当前迭代次数小于 100000，则计算当前的损失函数值并将其添加到 J_history 中。另外，每隔一定的迭代次数就将当前的权重值添加到 w_history 中。最后，函数返回更新后的权重和偏置值以及 J_history 和 w_history。接下来，代码使用 np.random.seed(1) 来设置随机种子，然后通过 np.random.rand(2).reshape(-1,1) - 0.5 来生成一个形状为 (2,1) 的随机数组，并将其乘以 0.01 再减去 0.5 得到 initial_w。同时，将 initial_b 设置为 -8，并将 iterations 和 alpha 分别设置为 10000 和 0.001。最后，调用 gradient_descent 函数来训练模型，并使用 plot_decision_boundary 函数来绘制决策边界。

简化并解释每行代码：X_train, y_train = load_data("data/ex2data2.txt") plot_data(X_train, y_train[:], pos_label="Accepted", neg_label="Rejected") plt.ylabel('Microchip Test 2') plt.xlabel('Microchip Test 1') plt.legend(loc="upper right") plt.show() mapped_X = map_feature(X_train[:, 0], X_train[:, 1]) def compute_cost_reg(X, y, w, b, lambda_=1): m = X.shape[0] cost = 0 f = sigmoid(np.dot(X, w) + b) reg = (lambda_/(2m)) np.sum(np.square(w)) cost = (1/m)np.sum(-ynp.log(f) - (1-y)np.log(1-f)) + reg return cost def compute_gradient_reg(X, y, w, b, lambda_=1): m = X.shape[0] cost = 0 dw = np.zeros_like(w) f = sigmoid(np.dot(X, w) + b) err = (f - y) dw = (1/m)np.dot(X.T, err) dw += (lambda_/m) * w db = (1/m) * np.sum(err) return db,dw X_mapped = map_feature(X_train[:, 0], X_train[:, 1]) np.random.seed(1) initial_w = np.random.rand(X_mapped.shape[1]) - 0.5 initial_b = 0.5 lambda_ = 0.5 dj_db, dj_dw = compute_gradient_reg(X_mapped, y_train, initial_w, initial_b, lambda_) np.random.seed(1) initial_w = np.random.rand(X_mapped.shape[1])-0.5 initial_b = 1. lambda_ = 0.01; iterations = 10000 alpha = 0.01 w,b, J_history,_ = gradient_descent(X_mapped, y_train, initial_w, initial_b, compute_cost_reg, compute_gradient_reg, alpha, iterations, lambda_) plot_decision_boundary(w, b, X_mapped, y_train) p = predict(X_mapped, w, b) print('Train Accuracy: %f'%(np.mean(p == y_train) * 100))

这段代码主要实现了一个二分类问题的训练和预测。下面是每一行代码的解释： ``` X_train, y_train = load_data("data/ex2data2.txt") ``` 从文件中读取训练数据，将特征存储在X_train中，将标签存储在y_train中。 ``` plot_data(X_train, y_train[:], pos_label="Accepted", neg_label="Rejected") plt.ylabel('Microchip Test 2') plt.xlabel('Microchip Test 1') plt.legend(loc="upper right") plt.show() ``` 画出训练数据的散点图，其中Accepted为正例标签，Rejected为负例标签，横坐标为Microchip Test 1，纵坐标为Microchip Test 2。 ``` mapped_X = map_feature(X_train[:, 0], X_train[:, 1]) ``` 将原始特征映射成更高维的特征，以便更好地拟合非线性决策边界。 ``` def compute_cost_reg(X, y, w, b, lambda_=1): m = X.shape[0] cost = 0 f = sigmoid(np.dot(X, w) + b) reg = (lambda_/(2*m)) * np.sum(np.square(w)) cost = (1/m)np.sum(-ynp.log(f) - (1-y)*np.log(1-f)) + reg return cost ``` 计算带正则化的逻辑回归代价函数，其中X为特征数据，y为标签，w为权重，b为偏置，lambda_为正则化参数。 ``` def compute_gradient_reg(X, y, w, b, lambda_=1): m = X.shape[0] cost = 0 dw = np.zeros_like(w) f = sigmoid(np.dot(X, w) + b) err = (f - y) dw = (1/m)*np.dot(X.T, err) dw += (lambda_/m) * w db = (1/m) * np.sum(err) return db,dw ``` 计算带正则化的逻辑回归梯度，其中X为特征数据，y为标签，w为权重，b为偏置，lambda_为正则化参数。 ``` X_mapped = map_feature(X_train[:, 0], X_train[:, 1]) np.random.seed(1) initial_w = np.random.rand(X_mapped.shape[1]) - 0.5 initial_b = 0.5 lambda_ = 0.5 dj_db, dj_dw = compute_gradient_reg(X_mapped, y_train, initial_w, initial_b, lambda_) ``` 将映射后的特征、权重、偏置和正则化参数传入梯度计算函数，计算出代价函数对权重和偏置的偏导数。 ``` np.random.seed(1) initial_w = np.random.rand(X_mapped.shape[1])-0.5 initial_b = 1. lambda_ = 0.01; iterations = 10000; alpha = 0.01 w,b, J_history,_ = gradient_descent(X_mapped, y_train, initial_w, initial_b, compute_cost_reg, compute_gradient_reg, alpha, iterations, lambda_) ``` 使用梯度下降算法对代价函数进行优化，得到最优的权重和偏置，lambda_为正则化参数，iterations为迭代次数，alpha为学习率。 ``` plot_decision_boundary(w, b, X_mapped, y_train) ``` 画出决策边界。 ``` p = predict(X_mapped, w, b) print('Train Accuracy: %f'%(np.mean(p == y_train) * 100)) ``` 使用训练好的模型进行预测，并计算训练精度。

阅读全文

修改为逻辑回归的代价函数：def compute_cost(X, y, w, b, lambda_=1): m = X.shape[0] y_hat = np.dot(X, w) + b cost = np.sum((y_hat - y) ** 2) / (2 * m) + lambda_ / (2 * m) * np.sum(w ** 2) return cost

相关推荐

机器学习逻辑回归（可修改）

逻辑回归算法1

逻辑回归1

损失函数剖析：预测模型优化的终极目标函数

Python代码优雅之道：Lambda表达式实战解析

梯度下降在线性回归中的应用：优化算法详解与实践指南

【揭秘MSE：机器学习损失函数的7个关键点】：精通均方误差（MSE）的原理与应用

【深度学习项目实操】：从教程到实际应用，转化知识为技能的完整路线图

凸优化约束处理：理论与实例应用指南

神经网络基础：Python代码实现与案例解析

多目标优化新境界：SQP算法的应用与技巧

KSOA云服务集成：AWS、Azure无缝对接全攻略

图像分类实战：使用简单神经网络与反向传播

非线性凸优化难题：方法与解决方案全解析

MATLAB云计算实战指南：云端计算，无限可能的探索

斯坦福凸优化高级主题：深度学习与优化的结合策略

def gradientDescent(X,y,theta,alpha,num_iters,Lambda):

大家在看

软件工程-总体设计概述(ppt-113页).ppt

计算机组成原理课程设计复杂模型机设计实现冒泡排序

C# 使用Selenium模拟浏览器获取CSDN博客内容

日常客服-《跳频通信》梅文华著

暗通道去雾算法_何凯明去雾_matlab_去雾_去雾算法_暗通道算法_

最新推荐

基于springboot+vue的体育馆管理系统的设计与实现（Java毕业设计，附源码，部署教程）.zip

二叉树的创建，打印，交换左右子树，层次遍历，先中后遍历，计算树的高度和叶子节点个数

鸿蒙操作系统接入智能卡读写器SDK范例

【天线】基于matlab时域差分FDTD方法喇叭天线仿真（绘制电场方向图）【含Matlab源码 9703期】.zip

QT 下拉菜单设置参数 起始端口和结束端口

探索zinoucha-master中的0101000101奥秘

【Qt与OpenGL集成】：提升框选功能图形性能，OpenGL的高效应用案例

ffmpeg 指定屏幕输出

个人网站技术深度解析：Haskell构建、黑暗主题、并行化等

Qt框选功能的国际化实践：支持多语言界面的核心技术解析

QT 下拉菜单设置参数起始端口和结束端口