收稿日期:20121029;修回日期:20121215 基金项目:国家自然科学基金资助项目(60841004,60971110,61172152)
作者简介:黄石磊(1986),男,河南漯河人,硕士研究生,主要研究方向为模式识别与智能系统;陈书立(1972),男,河南扶沟人,助理工程师,
主要研究方向为智能仪器仪表及电子产品的开发与研究;刘驰(1985),男,河南驻马店人,硕士研究生,主要研究方向为控制理论与控制工程;袁
道任(
1987),男,河南开封人,硕士研究生,主要研究方向为控制理论与控制工程;娄亚飞(1989),男,河南商丘人,硕士研究生,主要研究方向为
控制理论与控制工程;张姗姗(1988),女,河南南阳人,硕士研究生,主要研究方向为控制理论与控制工程;逯鹏(1974),男(通信作者),副教授,
博士,主要研究方向为智能系统、模式识别技术(lupeng@zzu.edu.cn).
基于视觉感知的运动目标跟踪算法
黄石磊,陈书立,刘 驰,袁道任,娄亚飞,张姗姗,逯 鹏
(郑州大学 电气工程学院,郑州 450001)
摘 要:针对运动目标跟踪问题,为解决跟踪过程中因遮挡、目标尺度变化等易造成跟踪失败的现象,提出一种
基于视觉感知的跟踪算法。该算法以神经元响应为视觉特征,首先从自然图像中学习初级视皮层细胞感受野;
然后计算背景图像和视频序列图像的神经元响应并得出差值,与动态阈值比较,识别出运动目标,通过迭代实现
目标跟踪。多类别实验结果表明,该算法实现了运动目标稳定跟踪,目标跟踪准确率达
93.5%且鲁棒性增强,与
典型算法 Camshift和 SIFT相比,提高了跟踪算法的准确性和鲁棒性。
关键词:运动目标跟踪;视觉感知;超完备集;神经元响应
中图分类号:TP301 文献标志码:A 文章编号:10013695(2013)07219903
doi:10.3969/j.issn.10013695.2013.07.069
Movingobjecttrackingalgorithmbasedonvisualperceptionmechanism
HUANGShilei,CHENShuli,LIUChi,YUANDaoren,LOUYafei,ZHANGShanshan,LUPeng
(SchoolofElectricalEngineering,ZhengzhouUniversity,Zhengzhou450001,China)
Abstract:Formovingobjecttrackingproblems,thispaperputforwardanobjectalgorithmbasedonvisualperception,inor
dertosolvethetrackingfailurephenomenonwhichwascausedbytheocclusionoftrackingprocessandthechangeofobject
scale.Thisalgorithmusedneuralresponseasvisualfeatures.Firstofall
,itstudiedprimaryvisualcortexcellreceptivefield
fromthenaturalimageandcalculatedtheneuronsresponseofbackgroundimagesandvideosequences
,anddrewthediffe
rence.Thenitidentifiedthemovingobjectbycomparingwiththedynamicthresholdvalue.Finally,itachievedobjecttracking
byiteratively.Themulticategoryexperimentresultsshowthatthealgorithm achievestrackingofthemovingobjectstability,
andthattheobjecttracking’saccuracyratehasachieved93.5% anditsrobustnessisenhanced.Comparedwiththetypicalal
gorithm,suchastheCamshiftandtheSIFT,thisalgorithmimprovestheaccuracyandrobustnessofthetrackingalgorithm.
Keywords:movingobjecttracking;visualperception;overcompleteset;neuralresponses
!
引言
运动目标跟踪有基于区域、基于特征、基于变形模板和基
于模型的方法
[1]
,典型算法有 Camshift
[2,3]
和 SIFT
[4,5]
等。利
用视觉感知机制解决运动目标跟踪问题是一种新方法。
基于完备基的稀疏编码模型模拟视觉计算图像视觉特征,
即图像的基函数,它要求基函数正交,并利用基函数解决特征
识别等问题
[6]
。正交系统能够快速地分解与重建,但单一正
交基变换不能反映图像的内在结构及特征且稀疏性不足
[7]
。
超完备模型更符合视觉特征提取机制,且具有很好的稀疏逼近
性能
[8,9]
。然而,该模型的输入空间和编码空间不对称,使稀
疏分解难度增大,模型求解更困难
[10,11]
。此外,在缺少高层语
义的条件下,如何利用初级视觉特征解决运动目标跟踪问题没
有很好地解决。
针对上述问题,采用能量模型法求解超完备模型,利用响
应系数矩阵
S而不是基函数矩阵 A表达视觉特征,解决稀疏
分解和模型求解难的问题;进而,通过神经元对不同视觉特征
响应的差别完成目标识别,并采用迭代方法实现动态跟踪。实
验表明,算法能够以小时间复杂度解决遮挡和目标尺度变化的
运动目标跟踪问题,在准 确 性 和 鲁 棒 性 指 标 方 面 优 于 传 统
方法。
"
超完备稀疏编码模型
稀疏编码模型:
I=
∑
m
i=1
A
i
s
i
+N (1)
其中:I为 n维自然图像,A
i
为 n维基函数,N为高斯噪声,s
i
为
响应系数,m为基函数个数。若 m=n,则 是 完 备 基 模 型;若
m>n,则 A是冗余的,即 A
i
之间线性相关,则式(1)转换为超
完备稀疏编码模型。
令感受野
W,在完备基模型下,A=W
-1
。A可逆是求解
完备基稀疏编码模型的基础。然而在超完备模型下 m>n,所
以 A
≠
W
-1
,造成 A求解难题。
为解决上述问题,采用概率密度函数的对数定义能量模
型,如式(2)所示:
第 30卷第 7期
2013年 7月
计 算 机 应 用 研 究
ApplicationResearchofComputers
Vol.30No.7
Jul.2013