文章编号:
1674-7070
(2010)
02
-0
118-06
一种基于不平衡样本集的摩托车识别算法
文学志
1
郑缸辉
1
赵英男
1
吴毅
1
摘要
提出了一种基于
HSV
( Hue-Satura-
tion-
V
alue)
空间的
Haar
小波特征和多
SVM
(Support
Vector
Machine)
分类器的
摩托车识别算法,以解决因样本比例不
平衡所导致的对摩托车识别性能差的问
题.首先在
HSV
颜色空间基于无符号小
波系数构造特征提取算法,然后对训练
数据应用所提出的样本重构方法得到若
干训练子集,基于各个训练子集训练相
应的
SVM
分类器,识别时将各
SVI
町的输
出结果进行融合即可得到最终识别结
果.实验结采表明:该方法识别性能高,
鲁棒性好,对于受数据的不平衡性严重
影响的对象识别具有较好的应用和推广
价值.
关键词
摩托车识别;特征提取;不平衡数
据;支持向量机
(SVM)
中图分类号
T
凹
9
1.
41
文献标志码
A
收稿日期
2009-12-16
基金项目国家高技术研究发展计划
(863
计
划)项目
(2006AAllZ221)
;国家自然科学基金
(60702076)
作者简介
文学志,男,博士,副教授,主要研究领域
为模式识别、图像处理等.
wwpub@
163.ωm
l
南京信息工程大学计算机与软件学院,南京,
210044
o
51
言
Introduction
在基于视觉的车辆识别中,统计模式识别方法由于识别性能高、
鲁棒性好及操作便捷而受到越来越多的关注,文献[
1-2
]介绍了利用
PCA
(Principal
Component
Aualysis
,主成分分析)进行特征提取然后采
用
SVM
(SUpport Vector
Machine
,支持向量机)或神经元网络分类器来
进行车辆检测的方法.
Goerick
等
[3]
介绍了利用局部方向编码(
Lo
cal
Orientation Code ,
LOC)
提取感兴趣区域(
Region
of
Interest,
ROI)
的边
缘特征信息,然后将
LOC
的直方图输入神经元网络(
N
eural
N etwork ,
NN)
来对车辆进行检测.
Papageorgiou
等
[4]
使用过完备的小波系数结
合
SVM
来进行车辆及行人的检测.
Schneiderman
[5]
使用截断的小波系
数特征结合
SVM
进行车辆的检测.
Sun
等
[6.7]
分别介绍了采用
Gabor
滤波器提取矩特征或采用
Haar
小波特征与
Gabor
特征相结合,然后
利用
SVM
分类器来进行车辆检测的方法.本文主要关注白天情形下
基于视觉的摩托车识别问题.针对当前在灰度空间基于有符号小波
系数的特征提取算法得到的特征存在类间变化小、类内聚类效果较
差导致分类复杂度高以及用于分类时的抗噪能力差的问题,本文提
出一种基于
HSV
( Hue-Saturation -V
alue
)颜色空间的
Haar
小波特征提
取方法.同时,道路上的摩托车一方面与车辆一样易于受到外界环境
如光照、道路、护栏、绿色植物、建筑物等的影响,另一方面还受路面
上车辆的影响,再加上道路上行驶的摩托车数量较少,使得训练数据
中摩托车(正类样本)数量远少于非摩托车(负类样本)数量,从而导
致传统统计模式识别方法、识别性能尤其是对摩托车的识别受到严
重影响,基于此,提出了一种样本重构方法,即首先将负类样本分成
若干份,将每一份与正类样本组成子训练集,基于每一个子训练集训
练相应的
SVM
分类器,识别阶段对每一个
SVM
分类器的输出结果进
行融合后得到最终的分类识别结果.实验结果表明:本文方法与文献
方法相比能显著提高对摩托车的识别性能.
1
方法描述
Method description
整个算法分为离线训练和在线识别两个阶段.离线训练阶段首
先对经特征提取后的训练样本数据进行重构,然后基于重构后的训
文章编号:
1674-7070
(2010)
02
-0
118-06
一种基于不平衡样本集的摩托车识别算法
文学志
1
郑缸辉
1
赵英男
1
吴毅
1
摘要
提出了一种基于
HSV
( Hue-Satura-
tion-
V
alue)
空间的
Haar
小波特征和多
SVM
(Support
Vector
Machine)
分类器的
摩托车识别算法,以解决因样本比例不
平衡所导致的对摩托车识别性能差的问
题.首先在
HSV
颜色空间基于无符号小
波系数构造特征提取算法,然后对训练
数据应用所提出的样本重构方法得到若
干训练子集,基于各个训练子集训练相
应的
SVM
分类器,识别时将各
SVI
町的输
出结果进行融合即可得到最终识别结
果.实验结采表明:该方法识别性能高,
鲁棒性好,对于受数据的不平衡性严重
影响的对象识别具有较好的应用和推广
价值.
关键词
摩托车识别;特征提取;不平衡数
据;支持向量机
(SVM)
中图分类号
T
凹
9
1.
41
文献标志码
A
收稿日期
2009-12-16
基金项目国家高技术研究发展计划
(863
计
划)项目
(2006AAllZ221)
;国家自然科学基金
(60702076)
作者简介
文学志,男,博士,副教授,主要研究领域
为模式识别、图像处理等.
wwpub@
163.ωm
l
南京信息工程大学计算机与软件学院,南京,
210044
o
51
言
Introduction
在基于视觉的车辆识别中,统计模式识别方法由于识别性能高、
鲁棒性好及操作便捷而受到越来越多的关注,文献[
1-2
]介绍了利用
PCA
(Principal
Component
Aualysis
,主成分分析)进行特征提取然后采
用
SVM
(SUpport Vector
Machine
,支持向量机)或神经元网络分类器来
进行车辆检测的方法.
Goerick
等
[3]
介绍了利用局部方向编码(
Lo
cal
Orientation Code ,
LOC)
提取感兴趣区域(
Region
of
Interest,
ROI)
的边
缘特征信息,然后将
LOC
的直方图输入神经元网络(
N
eural
N etwork ,
NN)
来对车辆进行检测.
Papageorgiou
等
[4]
使用过完备的小波系数结
合
SVM
来进行车辆及行人的检测.
Schneiderman
[5]
使用截断的小波系
数特征结合
SVM
进行车辆的检测.
Sun
等
[6.7]
分别介绍了采用
Gabor
滤波器提取矩特征或采用
Haar
小波特征与
Gabor
特征相结合,然后
利用
SVM
分类器来进行车辆检测的方法.本文主要关注白天情形下
基于视觉的摩托车识别问题.针对当前在灰度空间基于有符号小波
系数的特征提取算法得到的特征存在类间变化小、类内聚类效果较
差导致分类复杂度高以及用于分类时的抗噪能力差的问题,本文提
出一种基于
HSV
( Hue-Saturation -V
alue
)颜色空间的
Haar
小波特征提
取方法.同时,道路上的摩托车一方面与车辆一样易于受到外界环境
如光照、道路、护栏、绿色植物、建筑物等的影响,另一方面还受路面
上车辆的影响,再加上道路上行驶的摩托车数量较少,使得训练数据
中摩托车(正类样本)数量远少于非摩托车(负类样本)数量,从而导
致传统统计模式识别方法、识别性能尤其是对摩托车的识别受到严
重影响,基于此,提出了一种样本重构方法,即首先将负类样本分成
若干份,将每一份与正类样本组成子训练集,基于每一个子训练集训
练相应的
SVM
分类器,识别阶段对每一个
SVM
分类器的输出结果进
行融合后得到最终的分类识别结果.实验结果表明:本文方法与文献
方法相比能显著提高对摩托车的识别性能.
1
方法描述
Method description
整个算法分为离线训练和在线识别两个阶段.离线训练阶段首
先对经特征提取后的训练样本数据进行重构,然后基于重构后的训