深入理解SVM：从八股简介到核心概念解析

需积分: 10 112 浏览量更新于2024-07-29 1 收藏 560KB PDF 举报

"这篇资源是一个关于SVM（支持向量机）的入门教程，旨在帮助初学者快速理解和进入SVM的世界。SVM是由Cortes和Vapnik在1995年提出的，尤其适用于小样本、非线性和高维模式识别任务，并可应用于函数拟合等其他学习问题。该教程基于统计学习理论的VC维理论和结构风险最小化原则，旨在寻找最佳的模型复杂性和学习能力之间的平衡，以提高模型的泛化能力。" 在深入探讨SVM之前，我们需要了解一些基本概念。Vapnik是统计机器学习领域的权威，他的著作《Statistical Learning Theory》阐述了统计机器学习的核心思想，即通过理论分析预测模型的性能，而传统机器学习则更多依赖于实践和经验。 VC维是衡量函数类复杂度的一个指标，它可以看作是问题的复杂性度量。SVM的优势在于其对VC维的关注，即使面对高维样本，SVM也能有效地处理，这得益于核函数的引入，使得SVM在处理如文本分类这样的高维数据时表现出色。结构风险最小化是SVM优化目标的关键概念。在机器学习中，我们通常需要找到一个近似模型（假设）来逼近未知的真实模型。由于真实模型无法直接获取，我们只能通过选择使得模型与真实解差距尽可能小的假设。结构风险最小化就是寻找这种差距最小化的策略，它在训练过程中权衡模型复杂性和泛化误差，以避免过拟合或欠拟合，从而提高模型在未见过的数据上的表现。 SVM的核心算法是最大间隔分类，它的目标是在训练数据中找到一个最优超平面，这个超平面能够最大程度地将不同类别的样本分开。通过使用核函数，SVM能够将数据映射到高维空间，使得原本在低维空间难以分离的非线性数据变得容易线性可分。在实际应用中，SVM可用于分类和回归任务，特别是在生物信息学、文本分类、图像识别等领域有广泛的应用。此外，SVM还可以与其他机器学习技术结合，例如集成学习，以提升模型的整体性能。 SVM是一个强大且灵活的机器学习工具，其理论基础深厚，实践效果显著。通过深入学习和理解SVM的基本原理和实践技巧，你将能够掌握这个强大的分类和回归方法，为你的数据分析和预测项目提供有力支持。

那么 wxi+b<0，而 yi 也小于 0，这意味着 yi(wxi+b)总是大于 0 的，而且它的值就等于|wxi+b|！

（也就是|g(xi)|）

现在把 w 和 b 进行一下归一化，即用 w/||w||和 b/||w||分别代替原来的 w 和 b，那么间隔

就可以写成

这个公式是不是看上去有点眼熟？没错，这不就是解析几何中点 xi 到直线 g(x)=0 的距

离公式嘛！（推广一下，是到超平面 g(x)=0 的距离， g(x)=0 就是上节中提到的分类超平面）

小Tips：||w||是什么符号？||w||叫做向量 w 的范数，范数是对向量长度的一种度量。我

们常说的向量长度其实指的是它的 2-范数，范数最一般的表示形式为 p-范数，可以写成如

下表达式

向量w=(w1, w2, w3,…… wn)

它的p-范数为

看看把 p 换成 2 的时候，不就是传统的向量长度么？当我们不指明 p 的时候，就像||w||

这样使用时，就意味着我们不关心 p 的值，用几范数都可以；或者上文已经提到了 p 的值，

为了叙述方便不再重复指明。

当用归一化的 w 和 b 代替原值之后的间隔有一个专门的名称，叫做几何间隔，几何间

隔所表示的正是点到超平面的欧氏距离，我们下面就简称几何间隔为“距离”。以上是单个

点到某个超平面的距离（就是间隔，后面不再区别这两个词）定义，同样可以定义一个点的

集合（就是一组样本）到某个超平面的距离为此集合中离超平面最近的点的距离。下面这

张图更加直观的展示出了几何间隔的现实含义：

H 是分类面，而 H1 和 H2 是平行于 H，且过离 H 最近的两类样本的直线，H1 与 H，

H2 与 H 之间的距离就是几何间隔。

之所以如此关心几何间隔这个东西，是因为几何间隔与样本的误分次数间存在关系：

剩余19页未读，继续阅读

散木振东

粉丝: 1
资源: 7

深入理解SVM：从八股简介到核心概念解析

SVM入门教程：从线性分类到核函数解析

libsvm SVM入门教程：从零开始学习

SVM入门教程：从线性可分到核方法详解

最易理解的SVM入门教程

一个非常不错的SVM入门教程

SVM 入门经典教程

SVM入门（通俗易懂的SVM教程）

SVM入门级别教程，适合初学者

支持向量机 svm 入门首选

2020新手入门：SVM预测教程解析

最新资源