Soft-Margin SVM：避免过拟合的策略

需积分: 0 46 浏览量更新于2024-08-05 收藏 1.18MB PDF 举报

"本文是林轩田《机器学习技法》课程笔记第四部分，重点讨论了Soft-Margin Support Vector Machine (SVM)的概念和动机。笔记中指出，Hard-Margin SVM虽然能够实现完美分类，但可能导致过拟合，尤其是当样本特征过多或者模型过于复杂时。为了解决这个问题，Soft-Margin SVM被提出，它允许一定数量的样本出现分类错误，以减少模型复杂度，防止过拟合。" 在Hard-Margin SVM中，目标是找到一个能将所有训练样本完全分开的决策边界，这意味着所有的样本点都需要正确分类。然而，这种方法对数据的分布非常敏感，如果数据中存在噪声或异常点，可能导致模型过于复杂，容易发生过拟合。过拟合通常是由于模型过于强大，能完美适应训练数据，但在未见过的数据上表现不佳。 Soft-Margin SVM的引入是为了缓解这一问题。它的核心思想是在优化过程中允许一部分样本（称为“噪声点”或“误分类点”）不满足最大间隔条件，即它们可以落在决策边界的一侧。在修正后的条件中，对于正确分类的样本，依旧要求它们距离决策边界的距离（即间隔）大于等于1，而对于噪声点，则没有这样的严格限制，允许它们落在间隔内。修正后的目标函数考虑了误分类的代价，通常引入一个惩罚项，以控制模型的复杂度。这样，Soft-Margin SVM在优化时不仅寻找最大的间隔，还试图最小化误分类的样本数量，找到一个平衡点，使得模型既有良好的泛化能力，又不至于过于简单以至于忽略数据中的重要模式。此外，笔记中提到了核函数的选择对于SVM性能的影响。核函数可以将原始数据映射到高维空间，使得原本线性不可分的数据变得可分。常见的核函数包括线性核、多项式核和高斯核（RBF，Radial Basis Function）。选择合适的核函数是确保模型有效性和泛化能力的关键步骤。 Soft-Margin SVM通过放松Hard-Margin SVM的严格分类要求，提供了更强的鲁棒性和更好的泛化性能，特别适用于存在噪声或异常值的复杂数据集。它通过权衡分类错误的数量和间隔大小，找到了一个折衷的解决方案，有效地防止了过拟合，从而提高了模型在新数据上的预测能力。

error和largeerror。这种分类效果是不完美的。





为了改正这些不足，我们继续做如下修正：





修正后的表达式中，我们引入了新的参数来表示每个点犯错误的程度值，。

通过使用error值的大小代替是否有error，让问题变得易于求解，满足QP形式要求。

这种方法类似于我们在机器学习基石笔记中介绍的0/1error和squarederror。这种

softmarginSVM引入新的参数。

至此，最终的SoftMarginSVM的目标为：

条件是：

其中，表示每个点犯错误的程度，，表示没有错误，越大，表示错误越

大，即点距离边界（负的）越大。参数C表示尽可能选择宽边界和尽可能不要犯错两

者之间的权衡，因为边界宽了，往往犯错误的点会增加。largeC表示希望得到更少的

分类错误，即不惜选择窄边界也要尽可能把更多点正确分类；smallC表示希望得到更

宽的边界，即不惜增加错误点个数也要选择更宽的分类边界。

与之对应的QP问题中，由于新的参数的引入，总共参数个数为，限制

剩余10页未读，继续阅读

巧笑倩兮Evelina

粉丝: 26
资源: 335

Soft-Margin SVM：避免过拟合的策略

林轩田《机器学习技法》课程笔记1 -- Linear Support Vector Machine1

林轩田《机器学习技法》课程笔记3 -- Kernel Support Vector Machine1

林轩田《机器学习技法》课程笔记2 -- Dual Support Vector Machine1

林轩田机器学习技法：连接Soft-Margin SVM与Kernel Logistic Regression

林轩田《机器学习技法》课程笔记13 -- Deep Learning1

林轩田《机器学习技法》课程笔记9 -- Decision Tree1

林轩田《机器学习技法》课程笔记5 -- Kernel Logistic Regression1

林轩田《机器学习技法》课程笔记7 -- Blending and Bagging1

林轩田《机器学习技法》课程笔记11 -- Gradient Boosted Decision Tree1

林轩田《机器学习技法》课程笔记14 -- Radial Basis Function Network1

最新资源