支持向量机(SVM)原理与推导解析

需积分: 10 30 浏览量更新于2024-09-07 收藏 16KB DOCX 举报

"SVM推导-draco.docx" 支持向量机（Support Vector Machine, SVM）是一种强大的监督学习算法，主要用于二分类任务。其核心思想是寻找一个最优的超平面，这个超平面能够最大程度地将不同类别的样本点分开。在二维空间中，这个超平面直观上是使得两类样本点距离最远的分界线。随着维度的增加，这个概念可以通过数学公式进行精确表述。在样本空间中，超平面可以表示为决策函数 \( w \cdot x + b = 0 \)，其中 \( w \) 是权重向量，\( b \) 是偏置项。样本点 \( (x_i, y_i) \) 到超平面的函数间隔定义为 \( y_i(w \cdot x_i + b) \)，而几何间隔是函数间隔的正比系数 \( \frac{1}{\|w\|} \)。如果所有样本点都满足间隔最大化，那么这个超平面就是最优的。在SVM的优化目标中，我们希望找到一个能够正确分类训练数据且具有最大几何间隔的超平面。数学上，这可以表示为最大化间隔的优化问题，即 \( \max_{w,b} \frac{1}{\|w\|} \)，同时需满足所有样本点的分类正确，即 \( y_i(w \cdot x_i + b) \geq 1 \) 对所有 \( i \) 成立。为了简化问题，通常会设定 \( \|w\|^2 = 1 \)，这样最大化间隔就等同于最小化 \( \frac{1}{2}\|w\|^2 \)。引入拉格朗日乘子 \( \alpha_i \) 和拉格朗日函数 \( L(w, b, \alpha) \)，我们可以构建对偶问题，避免直接处理 \( w \)。拉格朗日函数通常定义为原始问题的目标函数加上违反约束的惩罚项，即 \( L(w, b, \alpha) = \frac{1}{2}\|w\|^2 - \sum_{i=1}^{N} \alpha_i(y_i(w \cdot x_i + b) - 1) \)。通过对 \( w \) 和 \( b \) 求导并令其等于零，可以解出 \( w \) 和 \( b \) 关于 \( \alpha \) 的表达式。在解决对偶问题时，KKT条件（Karush-Kuhn-Tucker 条件）是必要的，它们确保了最优解满足原始问题和对偶问题的一致性。KKT条件指出，对于每一个训练样本，要么 \( \alpha_i = 0 \) 而对应的样本点不参与分类决策（非支持向量），要么 \( 0 < \alpha_i < C \) 并且样本点位于间隔边界上（支持向量）。这里的 \( C \) 是惩罚参数，控制了对误分类的容忍度。线性不可分的情况下，SVM通过引入核函数（如高斯核、多项式核等）将低维线性不可分问题转换为高维线性可分问题。核函数能够将数据非线性映射到一个新的特征空间，使得在新空间中的数据变得线性可分，从而实现分类。 SVM通过寻找最大间隔超平面，解决了分类问题，并通过拉格朗日对偶性简化了优化过程，同时利用核函数扩展到非线性场景。在实际应用中，SVM表现出优秀的泛化能力和对小样本数据的高效处理能力。

支持向量机是一种二分类模型，他的基本想法就是基于训练集和样本空间中找到一个最好

的划分超平面，将两类样本分割开来，首先你就要知道什么样的划分发才能称为“最”好划

分

 看上图，二维平面上有两类样本，一类是用‘+’表示，另一类用‘-’表示，那么中间那几条

划分线每条都能将两类样本分割开来，但我们我们一眼就注意到中间那条加粗的划分超平

面，似乎他是最好的，因为两类的样本点都离他挺远的，专业点说就是该划分超平面对训

练样本局部扰动的‘容忍’性最好。好，这还只是个二维平面，我们可以通过可视化大概寻找

这样一个超平面，但如果三维，四维，五维呢，我们必须用我们擅长的数学去描述它，推

导它。‡‡‡‡‡‡‡‡

    在样本空间中，划分超平面可用表示，记为（w,b）,样本点（xi,yi）到划分超平面

的函数间隔为，几何间隔为：

  若，可知函数间隔和几何间隔相等，若超平面参数 w，b 成比例的改变（超平面没有

变），则函数间隔也是成比例的改变，而几何间隔不变。

 支持向量机的基本想法就是求解能够正确划分训练数据集并且几何间隔最大的分离超平

面，表达为数学公式即为：发‡‡‡‡

   其实函数间隔的取值并不影响最优化问题的解，假设将 w 和 b 成倍的改变为

aw，ab，那么函数间隔也会相应变成 a，函数间隔的对上面最优化问题的不等式没有影响，

也对目标函数没有影响，因此为简便，取，而且我们注意到最大化等价于最小化（为啥取

平方呢，因为后面好求导），便可得到下面支持线性可分（线性不可分的情况后面会提

到）的支持向量机的最优化问题

这是一个凸二次优化的问题，可以直接求解，但是为了简便呢，我们要应用拉格朗日对偶

性，求解他的对偶问题

  其实求解对偶问题相比于原问题有一下几点好处(1).对偶问题更容易求解，因为不用求

w 了‡(2)我们可以自然引入核函数，这样可以推广到线性不可分分类问题上

 建立拉格朗日函数，引进拉格朗日乘子，定义拉格朗日函数：

下载后可阅读完整内容，剩余3页未读，立即下载

DRACO于

粉丝: 8363

支持向量机(SVM)原理与推导解析

最新版 native-image-installable-svm-java17-windows-amd64-22.3.0.jar

SVM-Train.cpython-36.pyc

python-sklearn-用法.docx

一种简单的可视化SVM软件-winsvm.rar

svm-fastapi-app.tar 一个名为 svm-fastapi-app.tar 的文件，包含了完整的 Docker

SVM-KMExample.rar_SVM_SVM-KM工具箱_SVM工具箱_svm-km

SVM-RFE.rar_RFE算法_SVM_SVM-RFE matlab_SVM-RFE算法流程_基因选择

一个SVM的demoRBFdemomatlab程序-svm-rbf-demo.rar

3DDWT-SVM-GC-master.rar_3DDWT-SVM-GC-master_SVM分类_光谱_高光谱 分类_高光谱S

SVM-with-Matlab.zip_SVM_operation

最新资源

3DDWT-SVM-GC-master.rar_3DDWT-SVM-GC-master_SVM分类_光谱_高光谱分类_高光谱S