SVM入门：最大间隔线性分类与Logistic回归的关系

需积分: 20 101 浏览量更新于2024-07-17 收藏 1.74MB PDF 举报

在第 7 章 "支持向量机" 中，我们深入了解了支持向量机（SVM），这是一种在二类分类问题中广泛应用的机器学习算法。SVM的基本思想是寻找特征空间中能够最大化类别间的间隔（即“最大间隔”原则），这样做的目的是提高模型的泛化能力和鲁棒性。 7.2 节首先介绍了支持向量机的概念，它是基于线性分类器的。线性分类器的核心目标是在高维数据空间中找到一个超平面，该超平面能清晰地分割两类数据。超平面的方程形式为 wTx + b = 0，其中 w 是法向量，b 是偏置项，x 是特征向量，y 是对应的类别标记（1 或 -1）。 7.2.1.1 部分讨论了 1 或 -1 的分类标准，这是 SVM 与逻辑回归的联系之一。逻辑回归原本用于二分类问题，但其输出值范围是 (0, 1)，通过sigmoid函数（logistic函数）将其映射到概率空间，使得预测结果更直观。在 SVM 中，这一映射虽然简化了决策边界，但核心仍是找到具有最大间隔的超平面。 7.2.1.2 Logistic 回归的输出通过阈值 0.5 来判断类别，当预测概率大于 0.5，则分类为正类（y=1），反之为负类（y=0）。实际上，SVM 中的分类是由 wTx + b 的符号决定的，而不是 sigmoid 函数，w 的方向决定了分类方向，而距离则由间隔大小控制。理解了线性分类的基础后，SVM 进一步扩展到了非线性分类，通过核技巧（kernel trick）将原始数据映射到高维特征空间，使得原本线性不可分的数据在新的特征空间中变得线性可分。常用的核函数包括线性核、多项式核和高斯核等，它们允许 SVM 在非线性情况下仍保持间隔最大化的优势。总结来说，第 7 章围绕支持向量机深入讲解了其作为线性分类器的原理，强调了间隔最大化的重要性，并展示了如何通过核技巧处理非线性问题。通过对 Logistic 回归的理解，我们可以更好地认识 SVM 的分类决策过程，及其在实际应用中的优势。后续章节可能会探讨更多关于 SVM 的优化方法、参数选择以及在各种机器学习任务中的实际应用案例。

其中

，出于方便推导和优化的目的，我们可以令 =1(对目标函数的优化没有影响) ，

此时，上述的目标函数转化为：

其中，s.t.，即 subject to 的意思，它导出的是约束条件。

接下来，就是如何求 w 和 b 的问题了。

针对这个问题，我们就可以找到一个 margin 最大的 classifier ，通过最大化 margin ，我们使得该分

类器在对数据进行分类时具有了最大的 confidence，从而设计决策最优分类超平面。

如下图所示，中间的红色线条是 Optimal Hyper Plane ，另外两条线到红线的距离都是等于的

：

等价于 = /||w||，故有稍后的 =1 时， = 1 / ||w||。

便是上文所定义的 geometrical margin，当令 =1 时，便为 1/||w||，而我们上面得到的目标函数便是在相

应的约束条件下，要最大化这个 1/||w||值。

剩余40页未读，继续阅读

kjx11

粉丝: 4
资源: 6

SVM入门：最大间隔线性分类与Logistic回归的关系

支持向量机邓乃扬.pdf

支持向量机.pdf_电子版_pdf版

支持向量机原理.pdf

第五章 支持向量机(SVM).pdf

南大出品 机器学习基础入门教程 机器学习导论 第06章 支持向量机 共24页.pdf

（时间管理）测井时间序列的支持向量机回归预测.pdf

计算机系统结构：第2章 数据表示与向量系统I.pdf

计算机系统结构：第5章 流水技术与向量处理V.pdf

第2章 MATLAB基本运算.pdf

第二章MATLAB数值计算.pdf

最新资源

第五章支持向量机(SVM).pdf

南大出品机器学习基础入门教程机器学习导论第06章支持向量机共24页.pdf

计算机系统结构：第2章数据表示与向量系统I.pdf

计算机系统结构：第5章流水技术与向量处理V.pdf