根据给定数据集（存放在data1.txt文件中，二分类数据），编码实现基于梯度下降的Logistic回归算法，并画出决策边界；3）梯度下降过程中损失的变化图；（4）基于训练得到的参数，输入新的样本数据，输出预测值；使用pycharm实现，要求结果有三张图

1、数据集预处理首先，需要将数据集文件（data1.txt）读入程序，将其转换成numpy数组格式，并对数据进行预处理，包括将标签转化为1和0，将特征矩阵进行归一化处理等。 import numpy as np import matplotlib.pyplot as plt from sklearn.utils import shuffle # 读取数据文件（生成numpy数组格式） def load_data(filename): data = np.genfromtxt(filename,delimiter=',') X = data[:,:-1] y = data[:,-1] y = np.array([1 if i == 1 else 0 for i in y]) # 将标签转化为1和0 X_std = (X - X.mean(axis=0)) / X.std(axis=0) # 归一化处理 return X_std, y X, y = load_data('data1.txt') X_train, y_train = X[:70], y[:70] # 训练集 X_test, y_test = X[70:], y[70:] # 测试集 # 绘制数据集 plt.scatter(X_train[y_train==0][:,0], X_train[y_train==0][:,1], color='r') plt.scatter(X_train[y_train==1][:,0], X_train[y_train==1][:,1], color='b') plt.xlabel('Feature 1') plt.ylabel('Feature 2') plt.title('Training Data') plt.show() # 对数据集进行随机重排 X_train, y_train = shuffle(X_train, y_train) 2、模型训练接下来，需要实现Logistic回归模型及其梯度下降算法。模型中需设置学习率、迭代次数、权重系数初始值等参数，可根据数据集的情况进行调节。为了可视化梯度下降的过程，需要记录每一次迭代后的损失函数值，并将损失函数的曲线绘制出来。 # 定义sigmoid函数 def sigmoid(z): return 1 / (1 + np.exp(-z)) # 定义损失函数 def cost_function(X, y, w): z = np.dot(X,w) h = sigmoid(z) J = -1 * np.sum((y * np.log(h)) + ((1 - y) * np.log(1 - h))) / len(X) return J # 定义梯度下降函数 def gradient_descent(X, y, w, lr, num_iter): m = len(X) loss_history = [] for i in range(num_iter): z = np.dot(X,w) h = sigmoid(z) gradient = np.dot(X.T, (h-y)) / m w -= lr * gradient loss = cost_function(X, y, w) loss_history.append(loss) return w, loss_history # 初始化权重系数 w_init = np.zeros(X.shape[1])+0.001 # 设置训练参数 lr = 0.1 num_iter = 100 # 模型训练 w, loss_history = gradient_descent(X_train, y_train, w_init, lr, num_iter) # 绘制损失函数曲线 plt.plot(range(num_iter), loss_history) plt.xlabel('Iteration') plt.ylabel('Loss') plt.title('Loss Function') plt.show() 3、绘制决策边界模型训练完成后，可绘制出模型的决策边界。对于Logistic回归模型，决策边界用线性方程来表示。在二维情况下，决策边界可表示为：w0 + w1*x1 + w2*x2 = 0，将其转化为直线方程：x2 = (-w0 -w1*x1) / w2。 # 绘制决策边界 x1 = np.linspace(-2, 2, 100) x2 = (-w[0] - w[1]*x1) / w[2] plt.scatter(X_train[y_train==0][:,0], X_train[y_train==0][:,1], color='r') plt.scatter(X_train[y_train==1][:,0], X_train[y_train==1][:,1], color='b') plt.plot(x1, x2, color='k', linewidth=1, linestyle='--') plt.xlabel('Feature 1') plt.ylabel('Feature 2') plt.title('Decision Boundary') plt.show() 4、模型预测最后，可使用训练好的模型对新的样本数据进行预测。对于一个新的样本，需要根据模型所学到的权重系数来计算预测值，然后将预测值进行二分类输出。 # 对新样本进行预测 def predict(X, w): z = np.dot(X,w) h = sigmoid(z) y_pred = np.array([1 if i > 0.5 else 0 for i in h]) return y_pred # 计算在测试集上的准确率 y_pred = predict(X_test, w) acc = np.sum(y_test == y_pred) / len(y_test) print('Accuracy:', acc) # 绘制测试集结果 plt.scatter(X_test[y_test==0][:,0], X_test[y_test==0][:,1], color='r') plt.scatter(X_test[y_test==1][:,0], X_test[y_test==1][:,1], color='b') plt.xlabel('Feature 1') plt.ylabel('Feature 2') plt.title('Test Data') plt.show()

相关推荐

logistic回归分类器鸢尾花_logistic回归_logistic回归分类器_回归分析_鸢尾花数据集_

Matlab实现基于逻辑回归(logistic)的多特征分类预测（完整程序和数据）

基于Logistic回归技术的随机梯度下降用于医学数据分类-研究论文

根据给定数据集（存放在data1.txt文件中，二分类数据），编码实现基于梯度下降的Logistic回归算法，并画出决策边界

给定二分类问题的训练集，格式为excel，数据为2列，40行，用matlab采用Logistic回归算法进行分类学习，画出散点图（正例和负例分别用不同点型表示）

二元logistic回归原理

请介绍一下逻辑回归模型以及如何用代码实现、和案例

logistic regression matlab

数学模型logistic编程

对率回归 python

吴恩达机器学习ex2

R语言实例基于Boston数据集的数据分析报告用logistic回归LDA线性

手写逻辑回归算法(Logistic Regression)配套数据文件

逻辑回归（Logistic Regression）是一种用于解决二分类（0或1）问题的机器学习算法.txt

Logistic算法（随机梯度下降法）的Python代码和数据样本

基于logistic回归+SVM+神经网络实现的分类算法实战源码+项目说明.zip

logistic_regression_data.txt-数据集

数据回归-基于logistic回归分析的P53下游基因判别分析模型.pdf

###对华为OD分布式操作系统的详细介绍

最新推荐

###对华为OD分布式操作系统的详细介绍

2110220116吴骏博.py

基于Java的ApplicationPower快速项目生成脚手架设计源码

基于MATLAB实现的OFDM经典同步算法之一Park算法仿真，附带Park算法经典文献+代码文档+使用说明文档.rar

基于MATLAB实现的imu和视觉里程计 kalman滤波器 进行融合+使用说明文档.rar

zigbee-cluster-library-specification

管理建模和仿真的文件

【实战演练】MATLAB用遗传算法改进粒子群GA-PSO算法

openstack的20种接口有哪些

JSBSim Reference Manual

基于MATLAB实现的imu和视觉里程计 kalman滤波器进行融合+使用说明文档.rar