SVM详解：原理与SMO算法深度推导

需积分: 50 15 浏览量更新于2024-09-09 2 收藏 1.04MB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

SVM (支持向量机)是一种强大的监督学习方法，广泛应用于分类和回归问题，尤其在处理线性和非线性数据时表现出色。其基本思想是通过寻找一个最优的决策边界（称为超平面），使得两类数据之间的间隔（Margin）最大化，即使在存在噪声的数据中也能保持较高的分类准确性。 1.1 SVM原理与决策边界 SVM的核心在于选择一条能够最大程度上区分不同类别的超平面。这个过程可以看作是在数据点周围画出的边际，即Margin。理想中的超平面应尽可能远离最近的数据点，这些离超平面最近的数据点被称为支持向量。SVM的目标就是在所有可能的超平面中找到具有最大Margin的那个，因为较大的Margin意味着更好的泛化能力。 1.2 SMO算法的推导 SVM的求解过程中，特别提到了Sequential Minimal Optimization (SMO)算法。SMO是一种迭代优化算法，针对的是大规模训练集中的线性SVM。它通过局部搜索策略，每次只考虑两个数据点（称为对偶变量），简化了优化问题，使得求解速度大大提高。SMO通过将复杂的二次规划问题转化为两个线性规划问题来求解，从而避免了计算量的指数级增长。在SMO算法中，关键步骤包括： - 确定局部极小点：在当前的决策边界附近，选取两个数据点，这两个点的梯度相互抵消，形成局部最小。 - 更新模型：基于这两个点，更新决策边界，然后删除它们，继续寻找下一个局部极小点。 - 重复以上步骤，直到所有可能的对偶变量对都检查过，或者达到预定的迭代次数。 SMO算法的优势在于它能够在大型数据集上高效地求解，使得SVM在实际应用中成为一种可行且高效的分类工具。总结来说，SVM通过最大化Margin来确定最优决策边界，支持向量作为关键元素，而SMO算法则是解决大规模SVM问题的有效手段。掌握SVM的原理和SMO的推导对于理解和支持向量机在实际项目中的应用至关重要。无论是理论学习还是工程实践，理解这些核心概念和技术都能帮助提升分类任务的性能。

资源详情

资源推荐

−2w

− 1w

+ b ≥ 1

−1w

− 0w

+ b ≥ 1

+ 0w

− b ≥ 1

透過聯立解及交集後，可以得到的 W=[1,-1]、b=2，但

是 QP 方法實在是效率太低了，當為正定時，用橢圓

法可在多項式時間內解二次規劃問題。當為非正定時，

二次規劃問題是 NP 困難的（NP-Hard）。即使 Q 只存

在一個負特徵值時，二次規劃問題也是 NP 困難的，可

以試想當資料有幾萬筆、每筆的特徵又有幾千個，這

樣的做法是非常非常消耗效能的。

2. Slack Variable

SVM 在不斷修正變化的過程中... 線可能會不斷地

偏移！甚至變得無法分出正確的選擇，因為有可能在

輸入值的時候輸入錯誤！導致我們給的 y 給錯，因而

造成許多不可挽回的錯誤，畢竟人有失足馬有亂蹄，因

此，為了避免這種情況發生，將太誇張、差太多的值給

剔除在調整的計算中。

2.1. Signiﬁcance

所以在這過程中，可能會有偏差過大或是錯誤的

數據出現 (如圖5)，導致計算出來的線並不是最理想的

線，因次需在這邊加入 1. 鬆弛變數 (ξ)：這個變數代

表的意思類似容錯率的概念，因此這個數值沒有負數，

而這個鬆弛變數是為每一個點所客製化的，因此他不

會是同一個數。2. 懲罰因子 (C)：這個因子代表的意

思是你有多重視離群點，所以當我們懲罰因子越大就

代表我們越重視離群點。這個概念有點像是當我的數

據出現錯誤時，要用多大力道去將分割線打到能越接

近數據正確的地方。這樣的話就能夠透過加入來適時

的容錯，也藉由這兩個來幫助找到最理想的線原本的

图 5. 偏差過大的點導致 SVM 線不理想

SVM 因為沒有加入鬆弛變數及懲罰因子的部分，所以

他所要求的值變得非常的硬性、非常直接並且強烈的

劃分出來，因此在沒有加入這兩項時的 SVM 有一個稱

呼”硬間隔”分類；在加入這兩項後，因為對錯誤的數

據或離群點有了兼容得特性出現，因此不會再這麼的

硬性劃分，也就變成了”軟間隔”分類。

2.2. Variety

已經說明了什麼是鬆弛變數及懲罰因子，了解他

們是做什麼用以及對我們的 SVM 有什麼樣的幫助，接

著將鬆弛變數加入式子中，上面有說過鬆弛變數是為

每個點所客製的所以代表每個點都有自己的一個鬆弛

變數，而這個鬆弛變數的目的就是要將原本錯誤的部

分分到正確的上面，因此就將鬆弛變數加入限制式中，

因為加入了鬆弛變數的關係而導致我們將每一個值都

是正確的，但是這樣會變成無限制的擴充，因為只有加

在限制式中，將限制式放寬了，但是要求的極小值卻沒

有變，所以接下來就要再求極小值那邊做變化，在這邊

將所有的鬆弛變數相加後再給他一個懲罰因子，因為

每加入一個鬆弛變數，就必須支付一次代價。：

期望求得：min

w,b

∥W ∥

+ C

∑

限制條件：y

(

− b

)

≥ 1 −ξ

, ξ

≥ 0

這樣加入到極值部分其實要想到剛剛一直說到的幾件

事：

1. 鬆弛變數 (ξ) 是客製化的變數，假如 A 點是被正

確的劃分的話，A 點鬆弛變數就是 0；假如 A 點

沒有被正確劃分且算出來的結果是-1 的話，A 點

的鬆弛變數就是 2。

2. 懲罰因子 (C) 會與“相加後的鬆弛變數”相乘並

放在極小值的求解地方是為了來表示有多重視離

群值。

上面兩件事可以知道當越重視離群值的話 C 就會越大，

代表說當他如果有離群值的話，會影響到整個最小值

的部份，有可能導致原本是可以很正確的分出，卻因為

幾個離群值而導致偏了方向。

3. Lagrange Multiplier

Lagrange Multiplier 又稱拉格朗日乘數法，其目

的是在一個函式且有約束條件下要求極值 (最大/最小

值)。此方法會引入一個以上新的未知數，而稱這個未

知數為拉格朗因子。看一下他要怎麼表示：

剩余10页未读，继续阅读

_小树不倒我不倒

粉丝: 0
资源: 6

SVM详解：原理与SMO算法深度推导

SVM训练过程与步骤

基本算法的伪代码

SVM分类算法C代码

支持向量机通俗导论（理解SVM的三层境界）

SVM分类器代码

SVM学习笔记+伪码.pdf

SVM推导过程

java基于ssm+jsp一家运动鞋店的产品推广网站系统源码 带毕业论文

51单片机Proteus仿真LCD1602+DS18B20的温度读取显示编程.rar

暴风电视 50F1 配屏V500HJ1-PE8(C3) 机编600000MWV00 屏参30162503 风UI1.0 本地升级

【高创新】基于蚁狮优化算法ALO-Transformer-BiLSTM实现故障识别Matlab实现.rar

java基于ssm+vue儿童影楼拍摄管理系统源码 带毕业论文

复杂网络建模-无向图(ER、WS、BA、RR)

VB企业人事管理系统设计与实现(开题报告+源代码+系统).zip

【高创新】基于鲸鱼优化算法WOA-Transformer-BiLSTM实现故障识别Matlab实现.rar

Matlab simulink仿真，直驱永磁风机并网chopper低电压穿越，版本matlab2018a

http服务器的实现.7z

【高创新】基于雾凇优化算法RIME-Transformer-LSTM实现故障识别Matlab实现.rar

vb+access电脑销售系统(论文+系统).zip

4-3_Education_ORANGE_2017_01.potx

最新资源

java基于ssm+jsp一家运动鞋店的产品推广网站系统源码带毕业论文

java基于ssm+vue儿童影楼拍摄管理系统源码带毕业论文