支持向量机训练算法详解与应用

需积分: 0 167 浏览量更新于2024-08-05 收藏 194KB PDF 举报

"支持向量机训练算法综述 - 刘江华, 程君实, 陈佳品 - 上海交通大学信息存储研究中心" 支持向量机（Support Vector Machine，SVM）是一种广泛应用于模式识别、数据挖掘、系统辨识与控制等领域的机器学习模型。该模型基于统计学习理论，尤其是经验风险最小化的概念，能够在处理小样本数据时提供较好的预测性能。本文主要概述了SVM的训练算法，并对比了不同算法的特点。 1. SVM-light为代表的分解算法：SVM-light是一种广泛应用的SVM求解器，它采用了拉格朗日乘子法来解决二次规划问题，通过分解大矩阵来求解支持向量。这种算法的优点在于计算效率较高，尤其适用于大规模数据集，但可能需要较大的内存空间。 2. 序贯分类方法：这类方法通常用于在线学习或增量学习场景，每次只考虑一个新样本进行更新。例如，Platt的Sequential Minimal Optimization (SMO)算法，它通过迭代优化一对拉格朗日乘子来逼近全局最优解。序贯分类方法的优点是适应数据流变化，但可能需要多次迭代才能达到稳定状态。 3. 在线训练法：在线学习算法如Stochastic Gradient Descent (SGD)在处理大规模数据时表现出色，因为它仅需处理每个样本一次，降低了计算复杂度。然而，这类算法可能对噪声敏感，收敛速度相对较慢，且可能需要调整学习率以防止过拟合。此外，文章还讨论了其他一些SVM训练算法，如Pegasos、LIBSVM等，并介绍了多类分类算法，如一对一（one-vs-one）、一对多（one-vs-rest）策略，以及如何将二分类SVM扩展到多分类问题。支持向量机的优势在于其能够找到最优的超平面，即最大间隔分类边界，这使得SVM对噪声和高维数据具有良好的鲁棒性。然而，选择合适的核函数和参数调整对于SVM的性能至关重要。未来的研究方向可能包括提高算法的效率、适应更复杂的数据结构，以及在分布式和并行计算环境下的优化。 SVM训练算法的选择取决于具体的应用场景和数据特性，理解这些算法的优缺点有助于在实际问题中有效应用和支持向量机的发展。

文章编号: 1002-0411( 2002) 01-045-06

支持向量机训练算法综述

刘江华程君实陈佳品

(上海交通大学信息存储研究中心上海 200030)

摘要: 本文介绍统计学习理论中最年轻的分支  支持向量机的训练算法 ,主要有三大类: 以

SV M -

lig ht

为代表的分解算法序贯分类方法和在线训练法 ,比较了各自的优缺点 ,并介绍了其它几种算法及多类

分类算法.最后指出了支持向量机具体实现的方向及其在模式识别数据挖掘系统辨识与控制等领域中的应

用.

⒇

关键词: 支持向量机 ; 训练算法; 统计学习理论

中图分类号: T P391. 4文献标识码: B

SUPPORT VECTOR MACHINE TRAINING ALGORITHM

A REVIEW

LIU Jiang

hua



C HENG Jun

shi



C HEN Jia

( In f ormation Stora ge Research Cent er , Shangha i Jiaotong University, Shang hai 200030)

Abstract

This a r ticle introduced the t raining alg o rith m for the newest bra nch of sta tistic lear ning theo-

r y

SV M

(

Suppo r t V ecto r M achine

) ,

which can be classified into thr ee categ ories

the fir st is the Deco mposi-

tion Alg orithm , who se deleg ate is SV M light

[2 ]

, the seco nd is sequence algo rithm, the third is o nline tr aining

a lgorithm. All the th ree kinds of a lg orithms ' adv antag es and disadva ntag es w er e ana ly sed. And o ther a lg o-

rithms and multi

class algo rithms a re int roduced too

Th e futur e directio n and a pplica tio n o f SV M in patte rn

recog nitio n and da ta mining , and so o n w ere intro duced.

Keywords: support v ecto r machine, t raining alg o rith m, statistical lear ning theo ry

1引言 (

Introduction

)

统计学习理论是目前针对小样本统计估计和预

测学习的最佳理论 ,它从理论上系统地研究了经验

风险最小化原则成立的条件有限样本下经验风险

与期望风险的关系及如何利用这些理论找到新的学

习原则和方法等问题 ,而支持向量机作为统计学习

理论的实现方法 ,受到广大的研究者的注意 .统计学

习理论因为对有限样本情况下模式识别中的一些根

本性问题进行了系统的理论研究 ,在很大程度上解

决了模型选择与过学习问题非线性和维数灾问题

局部极小点问题等 , 因此成为研究的热点

[24, 22 ]

[24] [ 43 ]分别对支持向量机的原理作了简要的介

绍 ,并和神经网络作了比较 ,本文则对支持向量机的

训练算法进行详细讨论 .

 Vapnik

[6 ]

将支持向量机问题归结为一个二次型

方程求解问题.

Vapnik

通过对线性不可分的两类问

题的最优分类形式提出的 .即使两类无错误地分开 ,

并使两类的分类间隙 ( Margi n)最大 . 问题的数学形

式为:

(w ,) =

(w  w ) + C



i= 1

i

s. t. yi ( ( w  xi ) + b)  1 - i , i = 1, , l

i  0, i = 1, , l.

通过求其对偶问题 ,归结为一个二次函数极值

问题:

W () =



i= 1

i -



i , j= 1

yi yjij K (xi , x j )

s. t. 0 i  C, i = 1, , l



i= 1

i yi = 0

分类判别函数为:

f (x ) = sig n [ (



i= 1

i yi K ( x , xi ) ) + b ]

对于这个二次规划问题 ,经典的解法有积极方

第 31卷第 1期

2002年 2月

 信息与控制

Info rmation and Co ntro l

V o l. 31, N o. 1

 Feb. , 2002

⒇收稿日期: 2001- 06- 05

DOI: 10. 13976 /j . cnki . xk. 2002. 01. 010

下载后可阅读完整内容，剩余5页未读，立即下载

小崔个人精进录

粉丝: 37
资源: 316

支持向量机训练算法详解与应用

基于Web的网络爬虫的设计与实现

支持向量机训练算法详解与应用

结构动力学有限元模型修正：目标函数与算法综述

固有频率向量损伤检测法在框架结构中的应用

南京审计大学在陕西2020-2024各专业最低录取分数及位次表.pdf

openjdk 1.8 带debug调试信息版本，可以查看标准库调试信息，在windows上运行 解压缩后直接使用

【Unity风格化滨海城市场景素材】Stylized Tuscany Seaside City

582、基于51单片机protues仿真的模拟1-20楼电梯系统（仿真图、源代码）

【Unity日系动漫风格插件】Quibli Anime Shaders and Tools

《把握linux内核设计思想》.pdf

最新资源

openjdk 1.8 带debug调试信息版本，可以查看标准库调试信息，在windows上运行解压缩后直接使用