支持向量机(SVM)详解：最大几何间隔与数学模型

需积分: 0 36 浏览量更新于2024-09-01 收藏 351KB DOCX 举报

"这是关于机器学习中支持向量机(SVM)的总结，涵盖了大量计算过程和图表，旨在帮助初学者理解和掌握SVM的基本概念和原理。" 在机器学习领域，支持向量机（Support Vector Machine，SVM）是一种非常有效的监督学习算法，尤其在分类问题上表现出色。在SVM中，我们寻找的是一个能够最好地将不同类别样本分开的超平面。与感知机类似，超平面是一个高维空间中的决策边界，由权重向量w和偏置项b定义，即w·x + b = 0。在二维空间中，w·x可以理解为向量w和x之间的内积，代表x在w上的投影的长度。感知机的分类规则是：如果w·x > 0，则样本被归类为正类，否则为负类。然而，感知机的问题在于，可能存在多个超平面可以正确地划分样本，这就引出了SVM的核心思想。 SVM的目标是找到一个能够最大化样本之间“间隔”（geometric margin）的超平面。间隔是指从最近的训练样本到超平面的距离，这提供了模型的泛化能力。理想情况下，我们希望找到一个使所有样本都远离决策边界的超平面，以便新样本出现时有更大的容错空间。因此，对于SVM，我们不仅要找到一个能正确分类样本的超平面，还要确保这个超平面具有最大的间隔。在数学建模中，SVM引入了一个正则化参数K（在这里设定为1），使得分类条件更为严格。在训练阶段，正样本需要满足w·x + b >= 1，而负样本需要满足w·x + b <= -1。这种约束条件确保了训练样本不仅被正确分类，而且与超平面保持一定距离。这也就意味着在训练过程中，SVM会尽量扩大间隔，以提高模型的鲁棒性和泛化能力。在实际应用中，SVM通过解决凸优化问题来找到最优的超平面，通常使用拉格朗日乘子法和软间隔概念。软间隔允许一部分样本违反分类条件，但会为此付出代价，从而平衡分类准确性和间隔最大化。此外，核技巧（如高斯核或多项式核）的应用使得非线性可分问题也能被SVM有效解决，通过在高维特征空间中构建非线性决策边界。支持向量机通过寻找最大间隔超平面，提供了一种强大的分类方法，其在处理小样本、高维数据和非线性问题时展现出良好的性能。通过优化训练过程中的间隔，SVM能够提高模型对未知样本的泛化能力，减少预测错误。对于初学者而言，理解SVM的间隔概念、数学模型以及核函数的运用是掌握这一技术的关键。

一些前提的约定，还是沿用上篇文章的哈。先来致敬下男神。

一：支持向量机（support vector machine）

在感知机那一章节我们讲了，对样本的分类过程中，可以用维度空间内的某个超平面

划分开来。Let’s recape it。

w⋅x 表示 w 和 x 的内积，用二维坐标简要介绍下，x=(x1,x2)，w=(w1,w2)，看

做是两个向量， x 在 w 向量的投影向量是 p ，长度是

‖

。因此 w⋅x =

‖

∗cos ⁡(θ)∗

‖

。在超平面内，这个投影是有方向的，也就是取决于

cos ⁡(θ)

的正负而

已。

感知机的超平面划分是这样的

y=f

(

)

{

1,∧w ⋅ x +b>0

−1,∧w ⋅ x +b<0

也就是在超平面的一边是正样本，一边是负样本。换句话说也就是如果我们通过模型

计算出的值大于 0，通过激活函数 sign，为(+1)，我们认为是正样本，反之则是负样本。

看似挺好的哈。但是我们还会发现一个问题，就是仅仅是超平面本身来划分样本空间，

这样的超平面是有很多很多的，如下图。

下载后可阅读完整内容，剩余4页未读，立即下载

星海千寻

粉丝: 303
资源: 16

支持向量机(SVM)详解：最大几何间隔与数学模型

微信小程序项目计划规划优质方案书--精选.doc.docx

基于jsp的网上办公系统--开题报告.docx

上海Linux运维工程师-面试题-个人总结).docx

学校与社会进步--Microsoft-Office-Word-文档.docx

班级管理----完美教室.docx

小学数学教案----万能模板.docx

SAP-EWM---快速指南.docx

专题七---国际关系.docx

中等职业学校--《哲学与人生》第一单元---练习二.docx

数字图像处理---考题.docx

最新资源