SVM入门解析：从基础到应用

需积分: 9 20 浏览量更新于2024-07-26 1 收藏 380KB DOC 举报

"SVM入门教程，讲解SVM的基本原理和应用，适合初学者学习" 支持向量机（Support Vector Machine，简称SVM）是一种监督学习算法，尤其在小样本、非线性和高维数据集上的分类和回归任务中表现突出。它的核心思想是通过构建最大边距超平面作为决策边界，将不同类别的数据点最大程度地分开。在SVM的理论基础中，Vapnik-Chervonenkis (VC) 维度是一个关键概念，它量化了一个模型的复杂度。VC维越高，表示模型能够学习的复杂模式越多，但也可能导致过拟合。SVM的目标是在保证分类性能的同时，选择具有较低VC维的模型，以达到较好的泛化能力。结构风险最小化是SVM追求的目标，这是统计学习理论中的一个重要原则。它强调在训练过程中，不仅要考虑模型在现有样本上的表现（即经验风险），还要考虑模型对未见过数据的预测能力（即期望风险）。通过优化这两者之间的平衡，SVM寻找一个在训练误差和潜在泛化误差之间有最优权衡的模型。 SVM的一个独特之处在于它引入了核函数。核函数能够将原始低维数据映射到高维空间，使得在高维空间中原本难以分离的数据在低维空间中变得可分。这使得SVM可以处理非线性问题，即使数据集的维度非常高，也能有效应对。在实际应用中，SVM广泛应用于各种领域，如文本分类、生物信息学、图像识别等。对于初学者而言，理解SVM的核心概念，包括最大边距、支持向量、核函数以及结构风险最小化，是掌握SVM的关键。同时，学习如何选择合适的核函数、调整超参数以及解决过拟合问题，也是掌握SVM实战技能的重要部分。 SVM提供了一种强大而灵活的工具，用于处理各种机器学习问题。其理论基础和实践应用都值得深入学习和探索，特别是对于那些希望在数据科学领域有所建树的人来说，SVM是必备的知识点之一。

　　其中的 δ 是样本集合到分类面的间隔，R=max ||xi||　i=1,...,n，即 R 是所有样本中（xi 是以向量表示的第 i 个样

本）向量长度最长的值（也就是说代表样本的分布有多么广）。先不必追究误分次数的具体定义和推导过程，只要

记得这个误分次数一定程度上代表分类器的误差。而从上式可以看出，误分次数的上界由几何间隔决定！（当然，

是样本已知的时候）

　　至此我们就明白为何要选择几何间隔来作为评价一个解优劣的指标了，原来几何间隔越大的解，它的误差上界

越小。因此最大化几何间隔成了我们训练阶段的目标，而且，与二把刀作者所写的不同，最大化分类间隔并不是

SVM 的专利，而是早在线性分类时期就已有的思想。

SVM 入门（四）线性分类器的求解——问题的描述 Part1

上节说到我们有了一个线性分类函数，也有了判断解优劣的标准——即有了优化的目标，这个目标就是最大化几何

间隔，但是看过一些关于 SVM 的论文的人一定记得什么优化的目标是要最小化||w||这样的说法，这是怎么回事呢？

回头再看看我们对间隔和几何间隔的定义：

　　间隔：δ=y(wx+b)=|g(x)|

　　几何间隔：

　　可以看出 δ=||w||δ 几何。注意到几何间隔与||w||是成反比的，因此最大化几何间隔与最小化||w||完全是一回事。

而我们常用的方法并不是固定||w||的大小而寻求最大几何间隔，而是固定间隔（例如固定为 1），寻找最小的||

w||。

　　而凡是求一个函数的最小值（或最大值）的问题都可以称为寻优问题（也叫作一个规划问题），又由于找最大

值的问题总可以通过加一个负号变为找最小值的问题，因此我们下面讨论的时候都针对找最小值的过程来进行。一

个寻优问题最重要的部分是目标函数，顾名思义，就是指寻优的目标。例如我们想寻找最小的||w||这件事，就可以

用下面的式子表示：

　　但实际上对于这个目标，我们常常使用另一个完全等价的目标函数来代替，那就是：

　　不难看出当||w||2 达到最小时，||w||也达到最小，反之亦然（前提当然是||w||描述的是向量的长度，因而是非负

的）。之所以采用这种形式，是因为后面的求解过程会对目标函数作一系列变换，而式（1）的形式会使变换后的

形式更为简洁（正如聪明的读者所料，添加的系数二分之一和平方，皆是为求导数所需）。

　　接下来我们自然会问的就是，这个式子是否就描述了我们的问题呢？（回想一下，我们的问题是有一堆点，可

以被分成两类，我们要找出最好的分类面）

　　如果直接来解这个求最小值问题，很容易看出当||w||=0 的时候就得到了目标函数的最小值。但是你也会发现，

无论你给什么样的数据，都是这个解！反映在图中，就是 H1 与 H2 两条直线间的距离无限大，这个时候，所有的

样本点（无论正样本还是负样本）都跑到了 H1 和 H2 中间，而我们原本的意图是，H1 右侧的被分为正类，H2 左

侧的被分为负类，位于两类中间的样本则拒绝分类（拒绝分类的另一种理解是分给哪一类都有道理，因而分给哪一

类也都没有道理）。这下可好，所有样本点都进入了无法分类的灰色地带。

剩余15页未读，继续阅读

u010323351

粉丝: 0
资源: 1

SVM入门解析：从基础到应用

一个非常不错的SVM入门教程

高清_OpenCV3入门教程_毛星云

svm分类器的资料和程序

机器学习的入门

人工智能实战-从 Python 入门到机器学习.zip

Python入门教程：易学易读的编程语言

Python入门教程：从零开始学习编程

支持向量机（SVM）实用指南

文本分类入门：向量空间模型与特征选择

Python机器学习入门：从零开始探索数据分析与算法

最新资源