支持向量机SVM:线性分类与核心概念解析

需积分: 10 1 下载量 136 浏览量 更新于2024-07-11 收藏 2.69MB PPT 举报
"支持向量机SVM是一个有效的分类模型,尤其在处理小样本、非线性和高维数据时表现出色。由Corinna Cortes和Vapnik于1995年提出,SVM的核心思想是寻找一个最优超平面,以最大化不同类别之间的间隔。在二维空间中,这个超平面表现为一条直线,将红蓝两种颜色的点有效地分开,其中红点对应y值为-1,蓝点对应y值为1。 支持向量是SVM的关键概念,它们是离超平面最近的数据点,对决策边界有直接影响。这些点决定了超平面的位置。SVM中的"机"指的是分类算法,即支持向量机作为一个分类器,用于构建决策边界。 线性分类器,如SVM,寻求一个超平面,其方程为wTx + b = 0,其中w是权重向量(超平面的法向量),b是截距,x是数据点的n维向量,y是对应的类别标签(1或-1)。选择1和-1作为类别标签源于Logistic回归,Logistic回归通过引入Sigmoid函数(g(z))将线性预测转换为0到1之间的概率,适合二分类问题。 线性回归是另一种基础模型,它假设特征与结果之间存在线性关系。线性回归模型用参数θ调整各个特征的影响,预测函数可以表示为θTx。然而,对于分类问题,线性回归不适用,因此引入了Logistic回归,它在特征到结果的映射中添加了一个非线性的Sigmoid函数,使得输出可以解释为概率。 Logistic回归的假设函数为g(z)=1/(1+e^(-z)),其中z=θTx,θ是参数向量,x是特征向量。当预测概率大于0.5时,通常认为属于正类(Y=1),反之则属于负类(Y=0)。 支持向量机SVM是一种强大的分类工具,通过寻找最优超平面实现数据分类,并利用支持向量确定分类边界。同时,它与线性回归和Logistic回归有着密切的联系,后者提供了理解分类问题的基础。在实际应用中,SVM因其优秀的泛化能力和处理非线性问题的能力而备受青睐。"