支持向量机训练算法详解与应用

需积分: 0 68 浏览量更新于2024-08-05 收藏 193KB PDF 举报

"支持向量机训练算法综述 - 刘江华等人" 支持向量机（Support Vector Machine，简称SVM）是机器学习领域的一种重要算法，它基于统计学习理论，尤其适用于小样本的学习和预测。SVM的核心思想是找到一个最优超平面，这个超平面能够将不同类别的样本点最大程度地分开。本文主要讨论了SVM的训练算法，包括三种主要类型：分解算法、序贯分类方法和在线训练法。 1. 分解算法：以SVM-light为代表的分解算法是SVM训练的早期方法之一。这种方法通过求解拉格朗日乘子问题来确定支持向量，从而构建最优超平面。分解算法通常适用于中等规模的数据集，因为它们需要解决大规模的线性方程组，计算复杂度较高。 2. 序贯分类方法：这种算法不一次性处理整个数据集，而是逐个或按批次处理样本。这种方法对内存的需求较小，适合处理大数据集，但可能需要较长的训练时间。例如，Platt's Sequential Minimal Optimization (SMO) 是一种著名的序贯分类算法，它通过迭代优化一对拉格朗日乘子来逼近全局最优解。 3. 在线训练法：在线训练算法，如Perceptron和Stochastic Gradient Descent (SGD)，每次只处理一个样本，更新模型参数。这种方法适合于流式数据和大规模数据集，因为它可以随着新数据的到达动态调整模型，但可能无法达到全局最优，而是在局部最优附近徘徊。除了上述三种主流算法，文章还提到了其他一些训练策略，比如核函数的选择和调整、软间隔最大化等，这些都对SVM的性能有显著影响。此外，多类分类算法也是SVM研究的重要方向，通过一对多、嵌套SVM等方式解决多于两类的问题。支持向量机由于其强大的泛化能力和对高维数据的良好处理能力，在模式识别、数据挖掘、系统辨识与控制等多个领域都有广泛应用。未来的研究方向可能包括提高算法效率、优化核函数、适应非结构化数据以及在分布式和并行计算环境下的SVM实现。总结起来，SVM训练算法的选择取决于实际问题的规模、计算资源以及对模型精度的要求。了解并掌握这些算法的优缺点，对于有效地应用SVM进行机器学习任务至关重要。

文章编号: 1002-0411( 2002) 01-045-06

支持向量机训练算法综述

刘江华程君实陈佳品

(上海交通大学信息存储研究中心上海 200030)

摘要: 本文介绍统计学习理论中最年轻的分支  支持向量机的训练算法 ,主要有三大类: 以

SV M -

lig ht

为代表的分解算法序贯分类方法和在线训练法 ,比较了各自的优缺点 ,并介绍了其它几种算法及多类

分类算法.最后指出了支持向量机具体实现的方向及其在模式识别数据挖掘系统辨识与控制等领域中的应

用.

⒇

关键词: 支持向量机 ; 训练算法; 统计学习理论

中图分类号: T P391. 4文献标识码: B

SUPPORT VECTOR MACHINE TRAINING ALGORITHM

A REVIEW

LIU Jiang

hua



C HENG Jun

shi



C HEN Jia

( In f ormation Stora ge Research Cent er , Shangha i Jiaotong University, Shang hai 200030)

Abstract

This a r ticle introduced the t raining alg o rith m for the newest bra nch of sta tistic lear ning theo-

r y

SV M

(

Suppo r t V ecto r M achine

) ,

which can be classified into thr ee categ ories

the fir st is the Deco mposi-

tion Alg orithm , who se deleg ate is SV M light

[2 ]

, the seco nd is sequence algo rithm, the third is o nline tr aining

a lgorithm. All the th ree kinds of a lg orithms ' adv antag es and disadva ntag es w er e ana ly sed. And o ther a lg o-

rithms and multi

class algo rithms a re int roduced too

Th e futur e directio n and a pplica tio n o f SV M in patte rn

recog nitio n and da ta mining , and so o n w ere intro duced.

Keywords: support v ecto r machine, t raining alg o rith m, statistical lear ning theo ry

1引言 (

Introduction

)

统计学习理论是目前针对小样本统计估计和预

测学习的最佳理论 ,它从理论上系统地研究了经验

风险最小化原则成立的条件有限样本下经验风险

与期望风险的关系及如何利用这些理论找到新的学

习原则和方法等问题 ,而支持向量机作为统计学习

理论的实现方法 ,受到广大的研究者的注意 .统计学

习理论因为对有限样本情况下模式识别中的一些根

本性问题进行了系统的理论研究 ,在很大程度上解

决了模型选择与过学习问题非线性和维数灾问题

局部极小点问题等 , 因此成为研究的热点

[24, 22 ]

[24] [ 43 ]分别对支持向量机的原理作了简要的介

绍 ,并和神经网络作了比较 ,本文则对支持向量机的

训练算法进行详细讨论 .

 Vapnik

[6 ]

将支持向量机问题归结为一个二次型

方程求解问题.

Vapnik

通过对线性不可分的两类问

题的最优分类形式提出的 .即使两类无错误地分开 ,

并使两类的分类间隙 ( Margi n)最大 . 问题的数学形

式为:

(w ,) =

(w  w ) + C



i= 1

i

s. t. yi ( ( w  xi ) + b)  1 - i , i = 1, , l

i  0, i = 1, , l.

通过求其对偶问题 ,归结为一个二次函数极值

问题:

W () =



i= 1

i -



i , j= 1

yi yjij K (xi , x j )

s. t. 0 i  C, i = 1, , l



i= 1

i yi = 0

分类判别函数为:

f (x ) = sig n [ (



i= 1

i yi K ( x , xi ) ) + b ]

对于这个二次规划问题 ,经典的解法有积极方

第 31卷第 1期

2002年 2月

 信息与控制

Info rmation and Co ntro l

V o l. 31, N o. 1

 Feb. , 2002

⒇收稿日期: 2001- 06- 05

DOI: 10. 13976 /j . cnki . xk. 2002. 01. 010

下载后可阅读完整内容，剩余5页未读，立即下载

亚赛大人

粉丝: 32
资源: 332

支持向量机训练算法详解与应用

基于Web的网络爬虫的设计与实现

支持向量机训练算法详解与应用

结构动力学有限元模型修正：目标函数与算法综述

固有频率向量损伤检测法在框架结构中的应用

数据挖掘（三）相关数据集资源

《GNU_Linux环境高级编程》.pdf

人工智能-基于kinect的人体动作识别系统源码（毕业设计）

福建农林大学在陕西2020-2024各专业最低录取分数及位次表.pdf

基于MATLAB火焰检测定位代码【带界面GUI】.zip

河南城建学院在陕西2020-2024各专业最低录取分数及位次表.pdf

最新资源