第 32卷 第 4期 控 制 与 决 策 Vol.32 No.4
2017年 4月 Control and Decision Apr. 2017
文章编号: 1001-0920(2017)04-0721-06 DOI: 10.13195/j.kzyjc.2016.0237
基于超椭球分类面的SVDD快速决策方法
曲建岭, 王小飞
†
, 高 峰, 袁 涛
(海军航空工程学院 控制系, 山东 青岛 266041)
摘 要: 针对现有支持向量数据描述 (SVDD) 快速决策方法在检测不同分布特性的未知样本时分类精度低下的
问题, 提出基于超椭球分类面的 SVDD(HE-SVDD) 快速决策方法. 该方法通过构建超椭球分类面, 提高了不同分
布类型数据的分类精度, 同时将 SVDD 的决策复杂度从 O(n) 降低到 O(2)(n 为支持向量数量). 首先研究超球分类
面快速决策方法的局限性, 进而给出超椭球分类面的构建方法. 在多种数据集上的实验结果表明, HE-SVDD 可以
在很大程度上提升现有快速决策方法的分类精度和适用数据类型.
关键词: 支持向量数据描述;超椭球分类面;快速决策;分类精度
中图分类号: TP181 文献标志码: A
Fast decision algorithm of SVDD based on hyper-ellipse classification
boundary
QU Jian-ling, WANG Xiao-fei
†
, GAO Feng, YUAN Tao
(Department of Control, Naval Aeronautical Engineering Institute, Qingdao 266041,China)
Abstract: For some difficult sample sets with different distribution properties, fast decision algorithms of suppor t vector
data description(SVDD) may obtain low classification accuracy. Therefore, a fast decision algorithm of SVDD based
on the hyper-ellipse classification boundary is proposed, which can reduce the testing complexity from O(n) to O(2) (n
is the suppor t vector number). The disadvantages of current decision methods are presented, and then the method of
constructing the hyper-ellipse classification boundary is proposed. Experimental results on multi-datasets show that the
proposed method can largely improve the classification accuracy and the applicability of existing fast decision algorithms.
Keywords: support vector data description;hyper-ellipse classification boundary;fast decision;classification accuracy
0 引
支 持 向 量 数 据 描 述 (SVDD) 是近年来发展较
快的一种单类分类方法
[1-2]
, 被广泛应用于人脸识
别
[3]
、故障诊断
[4]
和医学图像分类
[5]
等各个领域. 标
准 SVDD 通过引入核映射使训练样本变得精密可
分
[6]
, 但核化处理不仅增加了 SVDD 训练复杂度, 也
使得其决策复杂度依赖于支持向量数量 n. 当前, 改
进 SVDD 性能的相关研究主要集中于降低训练复杂
度, 主要有: 1) 训练样本规模约减, 包括样本随机分
割
[7]
、冗余式样本约减
[8]
、K-最远邻近点样本约减
[9]
、
样本聚类分割
[10]
和启发式样本约减
[11]
等; 2) 训练规
则优化, 包括最小二乘法
[12]
、对偶坐标下降法
[13]
、自
适应学习法
[14]
、在线学习法
[15]
和增量在线学习法
[16]
等. 由于 SVDD 的决策速度对于大规模样本的实时
检测至关重要, 本文主要针对SVDD的决策复杂度问
题进行研究.
标 准 SVDD 的 决 策复 杂 度为 O(n), 现 有 的快
速 决 策 方 法 都 是 寻 找 超 球 球 心 原 像. 其 中 FDA-
SVDD
[17]
和 F-SVDD
[18]
算法都是先寻找一个与超球
球心矢量方向一致且在输入空间中存在原像的向
量; 然后将它的原像作为超球球心在输入空间中的
近似原像, 并构建一个刚性超球分类面. 两种算法将
SVDD的决策复杂度降低为 O(1). 为将F-SVDD推广
到多聚类中心数据, E-SVDD
[19]
算法首先采用聚类思
想将训练样本分割为 k 个子集; 然后在各个子集上运
用F-SVDD算法构建多个超球分类面, 其决策复杂度
为 O (k). 上述方法构建的分类面都是输入空间中的
刚性超球, 因而只适用于具有特定分布的目标数据
集,泛化能力有限.
针 对 上述 问题, 提 出一 种基 于 超 椭 球 分 类面
收稿日期: 2016-03-03;修回日期: 2016-06-03.
基金项目: 国家自然科学基金项目(51505491).
作者简介: 曲建岭 (1968−), 男, 教授, 博士生导师, 从事飞参数据的应用等研究;王小飞 (1986−), 男, 硕士生, 从事
模式识别与智能系统的研究.
†
通讯作者. E-mail: cody05@163.com