理解支持向量机：线性与非线性分类的策略

需积分: 0 182 浏览量更新于2024-08-04 收藏 833KB DOCX 举报

"第六章支持向量机1" 支持向量机（SVM，Support Vector Machine）是一种广泛应用于二分类任务的监督学习模型。它的核心思想是寻找一个能够最大化类别间间隔的决策边界，这使其区别于早期的感知机模型。SVM通过引入核函数，能够处理线性不可分的数据，从而实现非线性分类。 1. 线性可分支持向量机：在数据线性可分的情况下，SVM采用硬间隔最大化的方法，寻找一个能将两类数据完全分开且具有最大间隔的超平面。这种模型是理想的分类器，但对噪声和异常点非常敏感。 2. 线性支持向量机：面对近似线性可分的数据，SVM采用软间隔最大化，允许一定数量的数据点落在决策边界内部，以增加模型的鲁棒性和泛化能力。这种模型被称为软间隔支持向量机。 3. 非线性支持向量机：对于线性不可分的数据，SVM利用核函数技术，将低维度的输入空间映射到高维度的特征空间，使得在特征空间中的数据变得线性可分。常见的核函数有多项式核、高斯核（径向基函数RBF）和sigmoid核等。核函数的选择直接影响模型的性能和复杂度。 4. 学习策略与优化目标：SVM的学习目标是找到一个最大化间隔的超平面，这通常转化为一个凸二次规划问题，或者等价于最小化正则化的合页损失函数。合页损失函数允许一定程度的误分类，同时鼓励大间隔。 5. 支持向量：在SVM中，距离超平面最近的训练样本点被称为支持向量，它们对决策边界的位置起决定性作用。只有支持向量参与了模型的构建，使得SVM在样本量大的情况下仍能保持高效。 6. 核技巧：核函数是SVM的关键，它使得在原始输入空间难以解决的非线性问题在高维特征空间中得以简化。核函数的选择直接影响模型的性能，需要根据具体问题选择合适的核函数。 7. 最优化算法：SVM的学习算法通常基于梯度下降法或 Cutting Plane Algorithm 等最优化方法，寻找最优的超平面。支持向量机是一种灵活且强大的机器学习工具，通过间隔最大化和核函数的使用，能够处理各种复杂的分类问题。理解并正确选择核函数以及调整模型参数是应用SVM时需要关注的重点。

可以看出：这样定义的函数间隔在处理 SVM 上会有问题，当超平面的两个参数 w 和 b 同比例改变时，

函数间隔也会跟着改变，但是实际上超平面还是原来的超平面，并没有变化。例如：

w1x1+w2x2+w3x3+b=0 其实等价于 2w1x1+2w2x2+2w3x3+2b=0，但计算的函数间隔却翻了一倍。

从而引出了能真正度量点到超平面距离的概念--几何间隔（geometrical margin）。

6.1.2 几何间隔

几何间隔代表的则是数据点到超平面的真实距离，对于超平面 w'x+b=0，w 代表的是该超平面的法向

量，设 x

为超平面外一点 x 在法向量 w 方向上的投影点，x 与超平面的距离为 r，则有 x

=x-r(w/||w||)，

又 x

在超平面上，即 w'x

+b=0，代入即可得：

为了得到 r 的绝对值，令 r 呈上其对应的类别 y，即可得到几何间隔的定义：

从上述函数间隔与几何间隔的定义可以看出：实质上函数间隔就是|w'x+b|，而几何间隔就是点到超平面

的距离。

6.2 最大间隔与支持向量

通过前面的分析可知：函数间隔不适合用来最大化间隔，因此这里我们要找的最大间隔指的是几何间隔，

于是最大间隔分类器的目标函数定义为：

一般地，我们令 r^为 1（这样做的目的是为了方便推导和目标函数的优化），从而上述目标函数转化

为：

剩余12页未读，继续阅读

吉利吉利

粉丝: 29
资源: 308

理解支持向量机：线性与非线性分类的策略

清华数据分析系列课程第七章：深入理解支持向量机

斯坦福机器学习课程第六章：支持向量机算法实战

支持向量机入门：理论与应用探索

第 6 章 支持向量机1

课后练习第六章 支持向量机

数学建模-09第9章 支持向量机.zip

【机器学习实战】机器学习实战第6章支持向量机算法数据集-数据集

19第19章 支持向量机(Python 程序及数据).rar

19第19章 支持向量机(Python 程序及数据).zip

数学建模-31第三十一章 支持向量机.zip

最新资源

第 6 章支持向量机1

课后练习第六章支持向量机

数学建模-09第9章支持向量机.zip

19第19章支持向量机(Python 程序及数据).rar

19第19章支持向量机(Python 程序及数据).zip

数学建模-31第三十一章支持向量机.zip