逻辑回归：机器学习中的分类问题基石

需积分: 50 116 浏览量更新于2024-07-15 收藏 835KB PDF 举报

分类器的logistic回归分析是一种广泛应用的机器学习方法，主要用于解决分类问题，它起源于线性回归但针对的是离散的输出变量。在机器学习领域，主要关注的问题类型可以分为数值预测和分类，而logistic回归正是针对后者的一种特殊算法。它属于广义线性模型，与普通的多重线性回归有相似的模型形式，即wx+b，只不过logistic回归通过logistic函数或多项式函数处理wx+b得到一个介于0和1之间的概率值p，这个值用来决定数据所属的类别。在logistic回归的具体流程中，首先需要收集相关的数据，可以来自各种来源。数据预处理至关重要，因为它要求数据为数值型且结构清晰，以便进行后续的距离计算。接下来是对数据进行探索性分析，以理解其特征和可能的关系。训练阶段是核心环节，通过优化算法寻找最佳的分类回归系数，这个过程通常耗时较多。在测试阶段，已经训练好的模型会快速地对新的数据进行预测分类。在使用算法时，需要将输入数据转化为结构化的数值形式，然后利用回归系数计算出每个数据点的类别概率。基于此概率，我们可以确定数据的最终分类，并进一步应用于更复杂的分类任务。值得注意的是，当面对二分类问题时，如果简单地使用线性回归拟合，可能会导致输出结果不是离散的类别，而logistic回归通过非线性转换解决了这个问题，确保了输出的类别边界明确。因此，logistic回归不仅是一种基础的机器学习工具，也是数据科学人员必备的技能之一，尤其是在医疗诊断、市场营销等领域，因其强大的预测和决策支持能力而受到青睐。

然而，直接这样设计阶跃函数不方便后面的优化计算，因为函数值不连续，

无法进行一些相关求导。所以，逻辑回归中，要先选了一个统一的函数，也就是

Sigmoid 函数，如公式 2-1 所示：

(2-1)

Sigmoid 函数的图像如下图所示，当 z>0 时，Sigmoid 函数大于 0.5；当 z<0

时，Sigmoid 函数小于 0.5。所以，可以将拟合曲线的函数值带入 Sigmoid 函数，

观察 ϕ(z)与 0.5 的大小确定其类标号。

Sigmoid 函数还有一个好处，那就是因为其取值在 0，1 之间。所以可以看做

是测试元组属于类 1 的后验概率，即 p(y=1|X)p(y=1|X)。其实这一点从图像也

可以看出来：z 的值越大，表明元组的空间位置距离分类面越远，他就越可能属

于类 1，所以图中 z 越大，函数值也就越接近 1；同理，z 越小，表明元组越不可

能属于类 1。

3.代价函数

阶跃函数告诉我们，当得到拟合曲线的函数值时，如何计算最终的类标号。

但是核心问题仍然是这个曲线如何拟合。既然是回归函数，我们就模仿线性回归，

用误差的平方和当做代价函数。代价函数如公式(3-1)所示：

(3-1)

剩余14页未读，继续阅读

weixin_42076956

粉丝: 16

逻辑回归：机器学习中的分类问题基石

逻辑斯特回归

逻辑回归分类算法 算法+源码+详细步骤

基于同态加密的多分类Logistic回归模型.pdf

python 多分类logistic回归分析

二元logistic回归分析和多元logistic回归分析区别

在对某一新药的研究中，记录了不同剂量x下有副作用的人数的比例p，具体数据在表12.8中给出.要求： (2)建立p关于x的Logistic 回归方程. 表12.8剂量与副作用数据 x 0.9 1.1 1.8 2.3 3.0 3.3 4.0 p 0.37 0.31 0.44 0.60 0.67 0.81 0.79

多元logistic回归分析

单因素logistic回归分析和二元logistic回归分析一个意思吗

多元有序logistic回归分析_SPSS实例教程：有序多分类Logistic回归

R语言logistic回归分析检验

最新资源

逻辑回归分类算法算法+源码+详细步骤