支持向量机(SVM)入门：从Logistic回归到SVM

机器学习

支持向量机

需积分: 10 27 浏览量更新于2024-09-12 收藏 878KB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

"该资源是一份关于机器学习中支持向量机（SVM）的上篇电子课件，由JerryLead编写，旨在帮助读者深入理解SVM。课件通过重新审视logistic回归来引入SVM的概念，强调SVM在有监督学习中的优越性，并讨论了如何通过优化训练数据的分类边界来提高模型性能。" 本文主要围绕支持向量机（Support Vector Machine，简称SVM）展开，这是一种广泛应用的有监督学习算法，尤其擅长于分类任务。SVM以其高效和泛化能力强的特点，被广泛认为是最佳的监督学习算法之一。首先，文章回顾了logistic回归，这是SVM的一个基础。logistic回归用于构建0/1分类模型，它将特征的线性组合通过logistic函数（sigmoid函数）映射到(0,1)区间，表示为y=1的概率。函数希尔伯特(theta)(x)的值决定了样本属于正类(y=1)的概率，当希尔伯特(theta)(x)大于0.5时，样本归类为正类，否则归为负类。这里的关键在于，希尔伯特(theta)(x)仅与theta^T*x有关，logistic函数更多地扮演了映射角色。进一步分析，logistic回归的目标是找到参数theta，使得正例的theta^T*x远大于0，负例的theta^T*x远小于0。这在图形上表现为，训练数据尽可能远离分类超平面（theta^T*x=0）。课件通过A、B、C三个点的例子说明，我们更关注那些靠近分类边界的点，而非所有点，因为优化这些关键点的位置可以带来更好的分类效果。在这一背景下，SVM进入视野。SVM的核心思想是在训练数据中寻找一个最大间隔的分类超平面，使得两类样本尽可能远离这个边界。这个间隔最大化的原则确保了SVM对未知数据的良好泛化能力。相比于logistic回归，SVM在处理非线性可分问题时更具有优势，因为它可以利用核技巧进行非线性转换，将原本不可分的问题转化为在高维空间中的线性可分问题。通过引入拉格朗日乘子和软间隔最大化，SVM允许一些样本点（支持向量）稍微越界，但同时对这些越界的程度施加了惩罚，从而在保持间隔最大化的同时，允许一定程度的错误。这种方法使得SVM能够灵活处理噪声和异常值，提高了模型的鲁棒性。这篇课件通过logistic回归的视角，为读者构建了一个从简单到复杂的理解路径，引导他们逐步进入SVM的世界。在接下来的SVM（下）中，可能将进一步探讨SVM的数学基础、优化过程以及如何实际应用SVM解决各类问题。

资源推荐