Logistic回归实验：线性分类与数据分析

需积分: 0 137 浏览量更新于2024-08-03 收藏 1.27MB PDF 举报

"NKUMachineLearning-lab2.1-线性logistics分类实验" 这篇内容涉及的是机器学习中的一个经典实验，特别是关于Logistic回归的实践应用。实验的目的是让学生掌握Logistic回归算法的实现，包括sigmoid函数、交叉熵损失函数以及梯度计算，并通过最小化函数执行梯度下降算法。实验数据集分为两个部分，ex2data1.txt用于线性分类，ex2data2.txt用于非线性分类，这两个数据集分别对应高校录取预测和芯片质量预测的问题。首先，实验要求读取ex2data1.txt文件中的数据。`numpy.loadtxt()`函数被用来完成这一任务，它能读取CSV格式的数据，其中分隔符参数设为逗号。读取的数据存储在变量`ex2data1`中，之后我们需要提取出前两列（即学生的两门考试成绩）到变量`X`，而第三列（录取标签）则被存储到变量`y`，并且要确保`y`是一个列向量。样本数量被存储在变量`m`中，这对于后续的计算非常重要。接着，为了更好地理解数据集，我们需要进行数据可视化。`matplotlib.pyplot`库的`plot()`函数用于绘制散点图，通过x轴表示第一门考试成绩，y轴表示第二门考试成绩。散点的颜色和形状依据录取状态进行区分，被录取的学生用蓝色"+"标记，未被录取的学生用黄色"o"标记。这样可以直观地观察到两类样本的分布情况，帮助分析数据的线性可分性。实验的下一步很可能是实现Logistic回归模型，这包括定义sigmoid函数，该函数将线性组合转换为概率值。然后是构建交叉熵损失函数，这是衡量模型预测与真实标签之间差异的常用方法。接下来，计算损失函数相对于模型参数的梯度，这将用于梯度下降算法。最后，调用一个最小化函数（如`scipy.optimize.minimize`），通过迭代更新参数以最小化损失函数，从而优化模型。整个实验旨在让学习者熟悉Logistic回归模型的构建过程，以及如何利用这种模型进行二分类问题的预测。同时，通过实际操作，加深对数据预处理、可视化和模型训练的理解。

实验 2: Logistic回归

实验目的

1、实现Logistic回归算法

、实现和

sigmoid

函数、基于交叉熵的损失函数和梯度计算

、调用最小化函数实现梯度下降算法

实验数据

1. ex2data1.txt-用于线性分类的数据集（高校录取预测）

2. ex2data2.txt-用于非线性分类的数据集（芯片质量预测）

实验步骤

1. 线性分类问题

在这部分的练习中，你将建立一个Lgistic回归模型来预测一个学生是否被

大学录取。假设你是一个大学某院系的管理者，你想根据每个申请人的两次考

试成绩来确定他们是否由能够入学。你有以前申请人的历史数据，可以作为训

练Logistic模型的训练集。

在文件

ex2data1.txt

中包含了我们本次线性分类实验的数据集，数据共三列：

每行表示一个申请人的历史数据，前两列为申请人的两个成绩；第三列为标签，

1表示能够入学，0表示不能入学。

1.1 读取数据

首先你需要做的是将

ex2data1.txt

文件中的数据进行读取，使用的方法是

numpy.loadtxt() ，具体要求如下：

1. 使用loadtxt函数读取数据存于变量ex2data1，注意指定分隔符参数。

2. 使用变量X储存ex2data1的前两列数据（申请人的两科成绩）。

3. 使用变量y储存ex2data1的第三列数据（标签，1表示能够入学，0表示不能

入学）

存为列向量。

使用变量

储存样本数量。

代码：

ex2data1 = np.loadtxt('.\ex2data1.txt',delimiter=',')

X = ex2data1[:,0:2]

y = ex2data1[:,[2]]#注意存为列向量的写法

m = np.shape(y)[0]

cell[2]

正确输出：

(100, 2) (100, 1)

1.2 可视化数据

下载后可阅读完整内容，剩余4页未读，立即下载

在挪威看海

粉丝: 44
资源: 6

Logistic回归实验：线性分类与数据分析

NKUMachineLearning-lab2.2-非线性logistics回归

SP2019-LAB2.1-3170103455-黄炯睿 1

NKUMachineLearning-lab3.2-神经网络反向传播

NKUMachineLearning-lab3.1-神经网络前向传播

SP2019-LAB2.1-3170103456-应承峻1

颜色分类leetcode-dsc-roc-curves-and-auc-lab:dsc-roc-curves-and-auc-lab

颜色分类leetcode-dsc-pca-in-scikitlearn-lab:dsc-pca-in-scikitlearn-lab

Gamer-Lab_SDK_Launcher:Gamer-Lab.com（例如Hl-Lab.ru）的GoldSource SDK启动器

rgb转lab代码matlab-IVC-Lab-2020:IVC-Lab-2020

PAF-Lab-3.2:PAF-Lab-3.2

最新资源