降低SVM运算复杂度：支持向量预选取方法综述

需积分: 10 162 浏览量更新于2024-08-26 收藏 677KB PDF 举报

SVM支持向量预选取方法综述是一篇针对支持向量机（SVM）在大规模数据集应用中的挑战而进行的研究。SVM因其卓越的分类性能和优秀的泛化能力，在众多领域如模式识别、机器学习和数据挖掘中表现出色。然而，其主要瓶颈在于训练过程中的高运算复杂度，这使得处理大规模数据集时效率低下，限制了其广泛应用。为了克服这一问题，研究者们提出了一系列支持向量预选取的方法。这些方法旨在通过在训练数据中筛选出关键的支持向量，从而减少数据集规模，显著降低SVM的训练时间。预选取的支持向量是决定分类超平面的关键因素，优化它们的选择可以保持或接近原始模型的分类精度，同时提高计算效率。文献回顾部分概述了现有的支持向量预选取策略，例如基于特征选择、核函数优化、样本聚类、局部搜索等方法。特征选择技术通过评估每个特征的重要性来剔除冗余信息，核函数优化则试图找到更高效的数据表示，使其在低维空间中更容易处理。样本聚类则将数据集划分为若干子集，分别构建子模型，再合并结果。局部搜索方法则是针对局部最优解进行搜索，避免全局搜索带来的计算负担。此外，文章还讨论了这些方法的优势与不足，以及在实际应用中的效果对比。一些方法可能牺牲了一定的泛化能力，但在特定场景下，如实时性要求高的任务中，这种牺牲可能是可接受的。未来的研究趋势可能包括开发更为智能的预选取策略，结合深度学习和增量学习技术，以及对算法的理论分析和实证验证的深入。 SVM支持向量预选取方法的研究是解决大数据背景下SVM效率问题的重要途径，它既关注理论创新，也关注实际应用中的效能提升。随着计算能力和算法理解的进一步发展，这一领域的研究将为大规模数据处理提供更加高效和精确的解决方案。

中国西安第八届中国信息融合大会 Xi’an China

836 The Eighth Chinese Information Fusion Conference 2017 年 7 月

SVM 的支持向量预选取方法综述



刘卫兵

，韩德强

，杨艺

1）西安交通大学，电信学院，综合自动化研究所，西安 710049；

2）西安交通大学，机械结构强度与振动国家重点实验室，航天航空学院，西安 710049

摘要：支持向量机（Support Vector Machine, SVM）由于其出色的分类性能，及优秀的泛化能力，已在

各个领域中得到了广泛的应用。然而，SVM 的运算复杂度高的缺点，阻碍了其在大规模数据集中的应用。

由于 SVM 的分类超平面仅由支持向量决定，为降低其运算复杂度，许多学者提出了多种支持向量预选取

方法，以在保证分类精度的前提下，削减数据集规模，减少 SVM 的训练时间。本文总结了该方向的研究

现状，并对未来发展进行了展望。

关键词：支持向量机；支持向量预选取；模式识别

中图分类号：TP273

Review of Approaches to Pre-extract Support Vectors for SVM

Liu Weibing

，Han Deqiang

，Yang Yi

1）Institute of Integrated Automation, Xi’an Jiaotong University, Xi’an 710049；

2) SKLSVMS, School of Aerospace, Xi’an Jiaotong University, Xi’an 710049

Abstract：Since SVM (support vector machine, SVM) has excellent classification performance and good

generalization ability, it is widely applied in many fields. However, applications of SVM in the large scale

datasets are seriously hampered by its high computational cost for training. Aiming to reduce the computational

cost, many researchers proposed different kinds of approaches to pre-extracting support vectors since the

classification hyperplane is only determined by support vectors in training. In this paper, we present the

currently proposed approaches to pre-extracting support vectors and discuss the development in future.

Key words：Support vector machine；pre-extraction；pattern recognition

收稿日期：2017-03-31

基金项目：国家自然科学基金（61573275，61671370）；国家 973 计划项目（2013CB329405）；中国博士后科学基金（2016M592790）；陕西省科技

计划项目（2013KJXX-46），中央高校基本科研业务费专项资金项目（NO.xjj2016066，No.xjj2014122）.

作者简介：刘卫兵（1989-），男，湖南省邵东县，博士研究生，研究方向：机器学习、信息融合及不确定性推理，Email:weibingliu33@163.com

引言

支持向量机（Support Vector Machine，SVM）

[1][2]

是 20 世纪 90 年代由 Vapnik 等人基于结构风险

最小化原则提出的一种机器学习方法。由于其具有

优良的分类性能和良好的泛化能力

[3]

，已在图像识

别

[4]

、疾病诊断

[5]

、电力负荷预测

[6]

以及文本分类

[7]

等领域中得到了广泛的应用，是机器学习的热点之

一。

SVM 的学习问题可以转化为一个带约束条件

的凸二次规划问题

[8]

，该问题的运算复杂度较高，

其求解过程所需的时间将随着数据规模的增大而

迅速增加。然而，随着科学技术的发展，人类收集、

存储数据的能力越来越强，大规模数据集在实际应

用中越来越常见，而 SVM 的运算复杂度高的缺点

妨碍了其在大规模数据集中的应用。针对该问题，

一方面可以通过改进学习算法本身来提升运算效

率，例如最小二乘支持向量机（LSSVM）

[9]

、序

贯最小优化算法（SMO）

[10]

以及增量 SVM

[11]

等，

这些算法都大大加快了 SVM 的学习过程；另一

方面，由于 SVM 训练所得的最优分界面仅由数据

集中少量的支持向量决定，如果可以对原始数据集

进行预处理，选出最有可能成为支持向量的样本，

然后使用这些被选取的样本训练 SVM，则训练

SVM 所需的时间将会大大减少。由于 SVM 的支持

向量预选取方法能够使得 SVM 在大规模数据集中

更好地发挥效用，因此受到了机器学习届的重视，

众多学者对此进行了研究，且已在图像识别

[12]

、故

障诊断

[13]

、语音识别

[14]

以及陀螺飘逸预测

[15]

等领域

中进行了实际应用。

下载后可阅读完整内容，剩余6页未读，立即下载

weixin_38717156

粉丝: 4
资源: 887

降低SVM运算复杂度：支持向量预选取方法综述

股市中支持向量机的应用综述.pdf

学习入门材料－支持向量机算法综述

Svm支持向量机效果

SVM支持向量机 完整代码

DBO蜣螂算法优化SVM支持向量机

svm支持向量机python代码实现

SVM支持向量机的Python代码

SVM支持向量机图像分类原理

SVM支持向量机分类模型

svm支持向量机matlab实例

最新资源

SVM支持向量机完整代码