优化SVM：二阶多项式核与Kernel Trick简化计算

需积分: 0 4 浏览量更新于2024-08-05 收藏 1.24MB PDF 举报

在林轩田的《机器学习技法》课程中，第三部分深入探讨了核支持向量机（Kernel Support Vector Machine，简称KSVM）的Kernel Trick。通常使用的二次多项式核函数是关键讨论点，其在标准形式下的SVM模型（如dual SVM）中，自由度决定了模型的复杂性和计算效率。自由度的增加会导致决策边界（SVM margin）变得更加复杂，且与高维特征空间中的内积计算直接相关，从而增加了计算的复杂度。标准的二次多项式核函数形式为 \( K(x, x') = (x^T \cdot x' + c)^2 \)，其中 \( c \) 是常数项。当样本数据维度 \( n \) 较大时，直接计算这种内积的复杂度随着维度的平方增长，成为优化问题（如QP）求解过程中的瓶颈。因此，通过Kernel Trick，将特征转换和内积计算结合在核函数\( K(x, x') \)中，能够将复杂的高维内积简化为低维空间的运算，从而避免了直接处理高维数据带来的计算困难。具体来说，二阶多项式核函数的例子中，\( K(x, x') \) 可以表示为 \( (x^T \cdot x' + c)^2 \)，在应用到SVM中时，系数 \( \alpha_i \) 中原本涉及 \( z \) 的部分被替换为 \( K(x_i, x_j) \)，这样就消除了对原始特征空间 \( \mathcal{X} \) 的依赖，降低了计算量。通过这种方式，计算的复杂度不再依赖于特征空间的维度 \( n \)，而是变为与样本空间维度 \( d \) 相关，大大提升了计算效率。总结来说，Kernel Trick通过引入核函数，将非线性问题映射到低维空间中解决，这对于处理大规模或高维数据的SVM模型尤为重要，因为它允许我们在保持模型性能的同时，降低实际计算的复杂度。尽管二阶多项式核函数是一个特例，但它展示了这一方法的潜力，并为其他类型的核函数（如高斯核、多项式核等）提供了类似优化思路。通过理解并利用Kernel Trick，我们可以更有效地构建和训练复杂的机器学习模型。

作者：红色石头公众号：AI有道（id：redstonewill）



上节课我们主要介绍了SVM的对偶形式，即dualSVM。DualSVM也是一个二次规划问题，可以用QP

来进行求解。之所以要推导SVM的对偶形式是因为：首先，它展示了SVM的几何意义；然后，从计算

上，求解过程“好像”与所在维度无关，规避了很大时难以求解的情况。但是，上节课的最后，我们

也提到dualSVM的计算过程其实跟还是有关系的。那么，能不能完全摆脱对的依赖，从而减少

SVM计算量呢？这就是我们本节课所要讲的主要内容。

我们上节课推导的dualSVM是如下形式：



其中是拉格朗日因子，共N个，这是我们要求解的，而条件共有N+1个。我们来看向量中的

，看似这个计算与无关，但是的内积中不得不引入。也就是说，如果

很大，计算的复杂度也会很高，同样会影响QP问题的计算效率。可以说，

这一步是计算的瓶颈所在。

其实问题的关键在于内积求解上。我们知道，z是由x经过特征转换而来：

如果从x空间来看的话，分为两个步骤：1.进行特征转换和；2.计算与

的内积。这种先转换再计算内积的方式，必然会引入参数，从而在很大的时候影响计算速

度。那么，若把这两个步骤联合起来，是否可以有效地减小计算量，提高计算速度呢？

我们先来看一个简单的例子，对于二阶多项式转换，各种排列组合为：

林轩田《机器学习技法》课程笔记3KernelSupportVector

Machine

KernelTrick

下载后可阅读完整内容，剩余8页未读，立即下载

懂得越多越要学

粉丝: 28
资源: 307

优化SVM：二阶多项式核与Kernel Trick简化计算

林轩田机器学习技法：连接Soft-Margin SVM与Kernel Logistic Regression

林轩田机器学习技法与基石 FUN-TIME合集解析

台湾大学林轩田机器学习技法：Linear Support Vector Machine深度解析

林轩田《机器学习技法》课程笔记4 -- Soft-Margin Support Vector Machine1

林轩田《机器学习技法》课程笔记1 -- Linear Support Vector Machine1

林轩田《机器学习技法》课程笔记2 -- Dual Support Vector Machine1

林轩田《机器学习技法》课程笔记5 -- Kernel Logistic Regression1

林轩田《机器学习技法》课程笔记13 -- Deep Learning1

林轩田《机器学习技法》课程笔记9 -- Decision Tree1

林轩田《机器学习技法》课程笔记7 -- Blending and Bagging1

最新资源