理解SVM：从入门到精通

需积分: 43 94 浏览量更新于2024-07-22 收藏 1.44MB PDF 举报

"支持向量机通俗导论" 支持向量机（Support Vector Machine，简称SVM）是一种监督学习模型，常用于分类和回归分析。本文旨在以通俗易懂的方式介绍SVM，分为三个层次来解析这一算法的核心概念。 ### 第一层：了解SVM #### 1.1 分类标准的起源：逻辑回归 SVM的诞生可以追溯到逻辑回归，一种处理二分类问题的线性模型。逻辑回归通过sigmoid函数将线性决策边界转换为概率输出，但无法提供最大间隔分类。 #### 1.2 线性分类的例子在二维平面上，线性分类通过一条直线（或超平面）将数据分为两类。线性分类器的目标是在数据点之间找到一个能最好地分离两类的边界。 #### 1.3 函数间隔与几何间隔 - **函数间隔** 是决策边界与最近的数据点之间的距离，考虑了决策边界的方程中的权重。 - **几何间隔** 是考虑了样本点的尺度后，决策边界与最近的数据点的实际距离，是实际应用中的间隔。 #### 1.4 最大间隔分类器 SVM的目标是找到最大化几何间隔的决策边界，以增加模型泛化能力，降低过拟合风险。 ### 第二层：深入SVM #### 2.1 从线性可分到线性不可分 - **对偶问题求解**：当数据线性不可分时，SVM通过解决其对偶问题来找到最优分类超平面。 - **K.K.T.条件** 是拉格朗日乘子法中的必要条件，确保优化过程中满足约束条件。 - **松弛变量** 用于处理那些不能被正确分类的数据点，使得优化过程更加灵活。 #### 2.2 核函数 - **核函数** 将低维的非线性数据映射到高维空间，使其变得线性可分。 - **处理非线性数据** 核函数如多项式核、高斯核（RBF）和Sigmoid核，能够帮助SVM在原始空间中难以区分的数据集上找到分类边界。 - **核函数的本质** 是一种隐式映射，无需显式计算高维空间中的点，仅需计算点对之间的内积。 #### 2.3 使用松弛变量处理outliers 松弛变量允许一部分数据点不严格满足间隔最大化，从而增强模型对异常值的容忍度。 ### 第三层：证明SVM #### 3.1 线性学习器与非线性学习器 - **感知器算法** 是最早的在线性可分情况下的学习算法，但它可能收敛于局部最优解。 - **Mercer定理** 保证了核函数的数学性质，使得在高维空间中的内积运算可行。 #### 3.2 损失函数 SVM使用**Hinge损失函数**，它对误分类点的惩罚随着距离超平面的远近而增加。 #### 3.3 最小二乘法 - 最小二乘法是寻找使所有训练样本误差平方和最小的模型参数的方法。 - 解法通常涉及梯度下降或正规方程组的求解。 #### 3.4 SMO算法 - **Sequential Minimal Optimization** 算法是求解SVM对偶问题的有效方法。 - SMO通过迭代优化一对拉格朗日乘子，保证每次迭代至少改进一个乘子的优化目标。 - 实现过程中涉及到坐标上升法和约束优化。 #### 3.5 SVM的应用 SVM在多种领域有广泛的应用，如文本分类、图像识别等。总结，SVM以其最大间隔的优化目标和核函数的引入，有效地解决了线性和非线性分类问题，同时具有良好的泛化性能。理解SVM的三层境界，可以帮助我们从基础到深入地掌握这一强大的机器学习工具。

1 第一层：了解 SVM 9

为了得到 γ 的绝对值，令 γ 乘上对应的类别 y，即可得出几何间隔（用 ˜γ 表示）

的定义：

˜γ = yγ =

ˆγ

∥w∥

(1.9)

从上述函数间隔和几何间隔的定义可以看出：几何间隔就是函数间隔除以 ∥w∥，而且函

数间隔 y(w

x + b) = yf (x) 实际上就是 |f(x)|，只是人为定义的一个间隔度量，而几何

间隔 |f(x)|/∥w∥ 才是直观上的点到超平面的距离。

1.4 最大间隔分类器 Maximum Margin Classiﬁer 的定义

对一个数据点进行分类，当超平面离数据点的“间隔”越大，分类的确信度

（conﬁdence）也越大。所以，为了使得分类的确信度尽量高，需要让所选择的超平面

能够最大化这个“间隔”值。这个间隔如图5中的 Gap / 2 所示。

图 5: 超平面间隔示意

通过由前面的分析可知：函数间隔不适合用来最大化间隔值，因为在超平面固定以

后，可以等比例地缩放 w 的长度和 b 的值，这样可以使得 f (x) = w

x + b 的值任意大，

亦即函数间隔 ˆγ 可以在超平面保持不变的情况下被取得任意大。但几何间隔因为除上

了 ∥w∥，使得在缩放 w 和 b 的时候几何间隔 ˜γ 的值是不会改变的，它只随着超平面的

变动而变动，因此，这是更加合适的一个间隔。所以，这里要找的最大间隔分类超平面

中的“间隔”指的是几何间隔。

于是最大间隔分类器（maximum margin classiﬁer）的目标函数可以定义为：

max ˜γ (1.10)

同时需满足一些条件，根据间隔的定义，有：

+ b) = ˆγ

≥ ˆγ, i = 1, ..., n (1.11)

剩余51页未读，继续阅读

nedvedlee

粉丝: 0
资源: 3

理解SVM：从入门到精通

支持向量机通俗导论.pdf

从零构建支持向量机(SVM) & 支持向量机通俗导论

支持向量机通俗导论1

支持向量机通俗导论 理解SVM的三层境界

支持向量机通俗导论（理解SVM的三层境界）Latex版.zip_SVM_python_支持向量机

支持向量机通俗导论 -- 理解SVM的三层境界

支持向量机通俗导论：从基础到实践

支持向量机通俗导论(理解SVM的三层境界)

支持向量机通俗导论（理解svm的三层境界）

【人脸识别】基于matlab GUI PCA人脸识别（识别率）【含Matlab源码 802期】.md

最新资源

支持向量机通俗导论理解SVM的三层境界