理解对偶支持向量机：从线性到非线性转换

需积分: 0 58 浏览量更新于2024-08-05 收藏 1.33MB PDF 举报

"这篇笔记主要讨论了林轩田教授的《机器学习技法》课程中的第二部分，关于对偶支持向量机（Dual Support Vector Machine，DSVM）的内容。笔记介绍了非线性SVM如何通过非线性变换处理高维问题，并提出了对偶问题的概念，以解决原问题随着维度增加而变得难以求解的问题。" 在机器学习中，支持向量机（SVM）是一种强大的分类和回归工具，尤其适用于处理线性和非线性数据。线性SVM寻找一个最大间隔的超平面来区分两类样本。然而，对于非线性可分的数据集，SVM利用核函数将原始数据映射到高维空间，使得在新空间中找到线性决策边界成为可能。这一过程称为非线性变换，它增加了模型的复杂度，降低了Vapnik-Chervonenkis（VC）维，从而控制了过拟合的风险。在描述的课程笔记中，作者提到了一个问题：当数据的维度（即特征数量）非常高时，直接在高维空间解决二次规划问题（QP问题）会变得非常困难。为了克服这个挑战，引入了对偶支持向量机。对偶SVM通过转换原问题，使其不再依赖于原始输入空间的维度，而是依赖于样本的数量N。这样，即使样本特征的维度（\( \phi \)）无限增大，对偶问题的求解复杂度仍然保持不变。对偶问题的转换涉及到拉格朗日乘子法，这是优化问题中一个常见的技巧。在最小化目标函数的同时考虑约束条件时，可以通过引入拉格朗日乘子将原问题转换为无约束的优化问题。在SVM的背景下，这个转换涉及将原始的优化问题与KKT条件相结合，KKT条件是优化问题的必要条件，确保了最优解满足原始问题的所有约束。在正则化问题中，我们有一个带约束的最小化问题，即最小化损失函数同时保持参数的范数在一定范围内。通过引入拉格朗日乘子，我们可以将这个有约束的问题转化为无约束的拉格朗日函数，最终求得的优化解是所有样本的拉格朗日乘子的线性组合。这种方式不仅简化了求解过程，而且在SVM的对偶形式中，这些乘子与支持向量密切相关，支持向量是决定分类边界的关键样本。对偶SVM的优势在于，它允许我们用核函数直接在原始输入空间之外操作，而不必显式地进行高维映射。这使得对偶形式特别适合处理高维和大规模数据集，因为它避免了在高维空间直接计算的复杂性。此外，对偶形式还提供了更多关于模型解释性的洞察，比如它可以直接揭示哪些样本（支持向量）对决策边界的影响最大。林轩田教授的课程笔记2探讨了对偶支持向量机如何解决非线性SVM中的维度灾难问题，并强调了对偶问题在优化和理解SVM模型中的关键作用。通过转换到对偶空间，我们可以得到一个更容易求解且更具实用性的模型，这对于处理现实世界中的复杂数据集至关重要。

如何将条件问题转换为非条件问题？上一节课我们介绍的SVM中，目标是：

，条件是：。首先，我们

令拉格朗日因子为（区别于regularization），构造一个函数：

这个函数右边第一项是SVM的目标，第二项是SVM的条件和拉格朗日因子的乘

积。我们把这个函数称为拉格朗日函数，其中包含三个参数：b，w，。





下面，我们利用拉格朗日函数，把SVM构造成一个非条件问题：





该最小化问题中包含了最大化问题，怎么解释呢？首先我们规定拉格朗日因子

，根据SVM的限定条件可得：，如果没有达到最

优解，即有不满足的情况，因为，那么必然有

。对于这种大于零的情况，其最大值是无解的。

如果对于所有的点，均满足，那么必然有

，则当时，其

有最大值，最大值就是我们SVM的目标：。因此，这种转化为非条件的SVM

构造函数的形式是可行的。

剩余10页未读，继续阅读

ShepherdYoung

粉丝: 40
资源: 337

理解对偶支持向量机：从线性到非线性转换

林轩田《机器学习技法》课程笔记4 -- Soft-Margin Support Vector Machine1

林轩田《机器学习技法》课程笔记1 -- Linear Support Vector Machine1

林轩田《机器学习技法》课程笔记3 -- Kernel Support Vector Machine1

林轩田机器学习技法与基石 FUN-TIME合集解析

林轩田机器学习技法：连接Soft-Margin SVM与Kernel Logistic Regression

林轩田《机器学习技法》课程笔记13 -- Deep Learning1

林轩田《机器学习技法》课程笔记9 -- Decision Tree1

林轩田《机器学习技法》课程笔记5 -- Kernel Logistic Regression1

林轩田《机器学习技法》课程笔记7 -- Blending and Bagging1

林轩田《机器学习技法》课程笔记11 -- Gradient Boosted Decision Tree1

最新资源