台湾大学林轩田机器学习技法：Linear Support Vector Machine深度解析

需积分: 25 150 浏览量更新于2024-09-07 收藏 1.03MB PDF 举报

"这篇学习笔记主要来自台湾大学林轩田教授的《机器学习技法》课程，专注于Linear Support Vector Machine（线性支持向量机）的讲解。笔记回顾了线性可分情况下的PLA（Perceptron Learning Algorithm）或pocket算法，并探讨了如何在多条分类线中选择最优的分割线，强调了大间隔（large margin）原则在分类中的重要性。" 在机器学习领域，支持向量机（SVM）是一种有效的监督学习模型，尤其适用于分类和回归任务。线性支持向量机（Linear SVM）是SVM的一种，它在处理线性可分的数据集时表现得非常有效。在本节课程中，作者通过讨论如何在多条可能的分类线上选择最佳的线来引入线性SVM的核心概念。在2D空间中，数据可以通过一条直线完全分离。当有多条直线可以实现完美分类时，我们需要一个标准来选择最佳的线。线性SVM的目标是找到一个能够最大化分类边界的直线，也就是所谓的最大间隔（large margin）分类器。这个间隔是指从最近的训练样本到分类边界的距离。 PLA和pocket算法是寻找这种分类边界的两种方法，它们通过迭代更新来逐步逼近最佳的分类线。然而，这些算法并不直接优化间隔，而是关注于错误率的减少。在实际应用中，支持向量机通过引入软间隔（soft margin）的概念，允许一定数量的样本点落在边界内，从而更有效地寻找大间隔分类器。对于软间隔，SVM引入了损失函数，如 hinge loss，来衡量违反间隔的样本的“代价”。优化目标是在最大化间隔的同时，尽可能减小这个损失。这样，即使有些样本不能严格满足大间隔条件，SVM也会尝试找到一个平衡点，使得整体的分类效果最优。支持向量是距离分类边界最近的样本点，它们决定了分类边界的形状。线性SVM的决策边界由支持向量决定，这也是其名称的由来。支持向量的存在使得模型对新样本的微小变化具有更好的鲁棒性，因为模型参数主要依赖于这些离边界最近的点。此外，SVM还具有很好的泛化能力，这得益于VC维理论（Vapnik-Chervonenkis dimension）。高间隔的分类器通常具有较低的VC维，意味着模型在未见过的数据上的表现通常会更好，因为它不会过度拟合训练数据。线性支持向量机通过最大化分类间隔来寻找最优的分类线，这种策略不仅考虑了训练数据的正确分类，还兼顾了对未知数据的泛化能力。在实际问题中，线性SVM由于其高效性和良好的泛化性能，经常被用作机器学习中的基础工具。

classtag

粉丝: 2
资源: 9

台湾大学林轩田机器学习技法：Linear Support Vector Machine深度解析

机器学习技法(台大-林轩田 课件

台湾大学林轩田机器学习技法

林轩田《机器学习技法》课程笔记1 -- Linear Support Vector Machine1

台湾大学林轩田机器学习基石课程学习笔记(来自公众号【AI有道】)

林轩田《机器学习技法》课程笔记2 -- Dual Support Vector Machine1

林轩田《机器学习技法》课程笔记3 -- Kernel Support Vector Machine1

台湾大学林轩田机器学习基石+技法笔记

台湾大学林轩田机器学习笔记-机器学习技法，机器学习基石

林轩田《机器学习技法》课程笔记4 -- Soft-Margin Support Vector Machine1

台湾大学林轩田机器学习基石课程学习笔记2+--+Learning+to+Answer+Yes-No1

最新资源

机器学习技法(台大-林轩田课件