理解支持向量机：从Logistic回归出发

需积分: 10 191 浏览量更新于2024-07-26 收藏 1.45MB DOC 举报

"支持向量机原理" 支持向量机(Support Vector Machine, SVM)是一种强大的有监督学习算法，广泛应用于分类和回归任务。它以其高效性和在高维空间中的优秀表现而受到赞誉。SVM的核心思想是找到一个最佳的分类超平面，该超平面能最大程度地分离不同类别的数据点，并且使得两类数据点距离超平面的距离最大化。在介绍SVM之前，我们先回顾一下logistic回归。logistic回归是一种二分类模型，它通过将特征的线性组合映射到(0,1)区间，表示为属于正类(y=1)的概率。模型的形式化表示为： \[ P(y=1|x; \theta) = \frac{1}{1 + e^{-\theta^T x}} \] 其中，\( x \)是特征向量，\( \theta \)是权重参数，\( g(z) \)即为logistic函数，将实数映射到(0,1)。logistic回归的目标是找到最佳的\( \theta \)，使得正例样本的预测概率接近1，负例样本的预测概率接近0。然而，logistic回归在处理紧贴分类边界的样本时可能表现不佳。支持向量机正是针对这一问题提出的。SVM并不专注于所有点的最优分类，而是特别关注那些离分类边界最近的点，即“支持向量”。这些点对决策边界的影响最大，因此SVM试图最大化这些点到决策边界的距离，从而提高模型的泛化能力。 SVM通过引入核函数（如线性核、多项式核、高斯核等）在原始特征空间上构建非线性决策边界。在高维空间中，即使原始数据不可分，SVM也能找到一个最优超平面，使得两类样本被有效地分开。优化目标通常涉及最小化软间隔（允许一定数量的误分类，通过惩罚项控制）或者最大化间隔（硬间隔，不允许任何误分类）。在解决非线性问题时，SVM的核技巧尤为关键。例如，高斯核（也称为径向基函数RBF核）可以将数据映射到无限维空间，使得原本非线性可分的问题变得线性可分。RBF核的表达式为： \[ K(x_i, x_j) = e^{-\gamma ||x_i - x_j||^2} \] 其中，\( \gamma \)是控制核宽度的参数，影响决策边界的形状和位置。支持向量机通过寻找最大间隔的决策边界，不仅解决了线性可分问题，还能有效处理非线性问题，尤其在小样本和高维数据集上表现出色。其核心优势在于通过优化支持向量的位置来构建模型，从而提高了模型的鲁棒性和泛化性能。SVM在文本分类、图像识别、生物信息学等多个领域都有广泛应用。

&&&&先抛开上面的二次规划问题，先来看看存在等式约束的极值问题求法，比如下面的最优化

问题：

&&&& &&&&

&&&目标函数是 '#，下面是等式约束。通常解法是引入拉格朗日算子，这里使用来表示算子，

得到拉格朗日公式为

&&&& &&&&

&&& 是等式约束的个数。

&&&然后分别对 # 和求偏导，使得偏导数等于 ，然后解出 # 和。至于为什么引入拉格朗日

算子可以求出极值，原因是 '#的 # 变化方向受其他不等式的约束，# 的变化方向与 '#

的梯度垂直时才能获得极值，而且在极值处，'#的梯度与其他等式梯度的线性组合平行，因

此他们之间存在线性关系。（参考《最优化与 (() 条件》）

然后我们探讨有不等式约束的极值问题求法，问题如下：

&&&& &&&&

&&&我们定义一般化的拉格朗日公式

&&&这里的和都是拉格朗日算子。如果按这个公式求解，会出现问题，因为我们求解的是最

小值，而这里的已经不是  了，我们可以将调整成很大的正值，来使最后的函数结果

是负无穷。因此我们需要排除这种情况，我们定义下面的函数：

&&&&

剩余28页未读，继续阅读

gao19890103

粉丝: 0
资源: 2

理解支持向量机：从Logistic回归出发

支持向量机原理讲解

支持向量机原理介绍

支持向量机原理.docx

支持向量机原理.pdf

SVM_SVM_

svc支持向量机原理

SVM支持向量机原理

HALCON支持向量机原理

svm支持向量机原理

最小二乘支持向量机原理

最新资源