"基于Mean-Shift优化的TLD视频长时间跟踪算法"
TLD(Tracking-Learning-Detection)是一种视频目标跟踪算法,它集跟踪、学习和检测于一体,旨在解决目标在复杂场景中的持续跟踪问题。然而,TLD算法的计算量较大,这限制了其在实时应用中的效率。为了解决这一问题,研究者提出了一种优化策略,即用Mean-Shift算法替代TLD中的光流跟踪算法。
Mean-Shift算法是一种非参数密度估计和模式搜索方法,以其较低的计算复杂度而著称。在优化后的TLD算法中,Mean-Shift用于寻找目标的最可能位置,而不是使用光流法。光流法虽然能提供精确的运动信息,但计算量较大,尤其是在处理大量像素的场景时。Mean-Shift算法则通过迭代过程找到高密度区域,以此作为目标的位置,速度更快。
优化的TLD算法还包括一个自检测机制,它通过比较目标模型与候选目标模型之间的巴氏系数(一种衡量两个概率分布相似性的指标)和预设阈值来判断跟踪是否失效。当巴氏系数低于阈值时,表明跟踪可能已经失败。此外,该算法还通过计算Mean-Shift跟踪返回的目标框与前一帧TLD返回的目标框之间的相似度,进一步确认跟踪的有效性。如果跟踪失败,系统会启动检测器对目标进行重新初始化,以恢复跟踪。
实验结果表明,这个基于Mean-Shift优化的TLD算法在视频长时间跟踪任务中表现出更高的鲁棒性和准确性。尤其是在跟踪速度上,优化后的算法有了显著提升,这使得它更适用于实时或资源受限的环境。同时,由于Mean-Shift的引入,算法对于光照变化、遮挡和目标形变等情况的适应能力也有所增强。
这项研究是由国家自然科学基金、浙江省基金和宁波市基金资助的项目,由肖庆国、叶庆卫、周宇和王晓东等人完成。他们在图像处理和振动信号处理等领域有深入的研究背景,通过这种优化,他们为视频目标跟踪领域提供了一个更为高效且准确的解决方案。
关键词:长时间跟踪,TLD,在线学习,Mean-Shift
中图分类号:TP391.41;TP301.6 文献标志码:A 文章编号:1001-3695(2015)03-0925-04 doi:10.3969/j.issn.1001-3695.2015.03.066