第 40 卷 第 1 期 电 子 科 技 大 学 学 报 Vol.40 No.1
2011年1月 Journal of University of Electronic Science and Technology of China Jan. 2011
·复杂性科学·
支持向量机理论与算法研究综述
丁世飞
1, 2
,齐丙娟
1
,谭红艳
3
(1. 中国矿业大学计算机科学与技术学院 江苏 徐州 221116;
2. 中国科学院计算技术研究所智能信息处理重点实验室 北京 海淀区 100080;
3. 中国科学院声学研究所高性能网络实验室 北京 海淀区 100190 )
【摘要】统计学习理论(statistical learning theory,SLT)是一种小样本统计理论,着重研究在小样本情况下的统计规律及学
习方法性质。支持向量机(support vector machinse, SVM)是一种基于SLT的新型的机器学习方法,由于其出色的学习性能,已
经成为当前机器学习界的研究热点。该文系统介绍了支持向量机的理论基础,综述了传统支持向量机的主流训练算法以及一
些新型的学习模型和算法,最后指出了支持向量机的研究方向与发展前景。
关 键 词 FSVM; GSVM; 统计学习理论; 支持向量机; 训练算法; TSVMs
中图分类号 TP181 文献标识码 A doi:10.3969/j.issn.1001-0548.2011.01.001
An Overview on Theory and Algorithm of Support Vector Machines
DING Shi-fei
1,2
, QI Bing-juan
1
, and TAN Hong-yan
3
(1. School of Computer Science and Technology, China University of Mining and Technology Xuzhou Jiangsu 221116;
2. Key Laboratory of Intelligent Information Processing, Institute of Computing Technology, Chinese Academy of Science Haidian Beijing 100080;
3. High Performance Network Laboratory, Institute of Acoustic, Chinese Academy of Science Haidian Beijing 100190)
Abstract Statistical learning theory is the statistical theory of smallsample, and it focuses on the statistical
law and the nature of learning of small samples. Support vector machine is a new machine learning method based
on statistical learning theory, and it has become the research field of machine learning because of its excellent
performance. This paper describes the theoretical basis of support vector machines (SVM) systematically, sums up
the mainstream machine training algorithms of traditional SVM and some new learning models and algorithms
detailedly, and finally points out the research and development prospects of support vector machine.
Key words fuzzy support vector machines; granular support vector machines; statistical learning theory;
support vector machines; training algorithm; twin support vector machines
收稿日期: 2010 − 12 − 15;修回日期: 2011 − 01 − 09
基金项目: 国家自然科学基金(60975039);江苏省基础研究计划(BK2009093)
作者简介: 丁世飞(1963 − ),男,博士后,教授,博士生导师,主要从事模式识别与机器学习、粗糙集与软计算及粒度支持向量机方面的研究.
支持向量机
[1-2]
(support vector machines,SVM)
是建立在统计学习理论
[3-4]
VC维理论和结构风险最
小化原理基础上的机器学习方法。它在解决小样本、
非线性和高维模式识别问题中表现出许多特有的优
势,并在很大程度上克服了“维数灾难”和“过学
习”等问题。此外,它具有坚实的理论基础,简单
明了的数学模型,因此,在模式识别、回归分析、
函数估计、时间序列预测等领域都得到了长足的发
展,并被广泛应用于文本识别
[5]
、手写字体识别
[6]
、
人脸图像识别
[7]
、基因分类
[8]
及时间序列预测
[9]
等。
标准的支持向量机学习算法问题可以归结为求
解一个受约束的二次型规划(quadratic
programming,QP)问题。对于小规模的二次优化问
题,利用牛顿法、内点法等成熟的经典最优化算法
便能够很好地求解。但是当训练集规模很大时,就
会出现训练速度慢、算法复杂、效率低下等问题。
目前一些主流的训练算法都是将原有大规模的QP
问题分解成一系列小的QP问题,按照某种迭代策
略,反复求解小的QP问题,构造出原有大规模的QP
问题的近似解,并使该近似解逐渐收敛到最优解。
但是如何对大规模的QP问题进行分解以及如何选
择合适的工作集是当前训练算法所面临的主要问
题,并且也是各个算法优劣的表现所在。另外,现
有的大规模问题训练算法并不能彻底解决所面临的
问题,因此,在原有算法上进行合理的改进或研究
新的训练算法势在必行。本文首先对支持向量机的