全卷积对称网络在目标尺度自适应追踪中的应用

1 下载量 114 浏览量 更新于2024-08-28 收藏 17.44MB PDF 举报
"基于全卷积对称网络的目标尺度自适应追踪" 本文介绍了一种针对目标追踪问题的新方法,特别是解决目标快速运动和尺度变化导致的追踪失效问题。该方法利用全卷积对称网络(Full Convolutional Siamese Network)实现目标尺度自适应追踪。全卷积网络在深度学习领域被广泛应用于图像处理任务,因其能够有效地提取图像特征而备受青睐。 首先,文章提到了使用MatConvNet框架来构建全卷积对称网络。MatConvNet是一个用MATLAB实现的深度学习库,它支持卷积神经网络的训练和推理。在这个网络中,输入是实验图像和目标模板,经过网络的处理,得到两者的多维特征图。接着,通过互相关操作,计算特征图之间的相似性,从而找到置信分数最高的点作为目标的中心位置。这种方法有助于准确地定位目标在图像中的位置,即使目标的位置发生快速变化。 接下来,文章提出了对中心位置进行多尺度采样的策略。通过对不同尺度的采样,可以适应目标大小的变化。同时,通过比较模板方差,剔除那些与模板方差相差超过1/2的错误样本,这一步有助于减少不准确的追踪结果。 为了确定最佳的追踪窗口尺度,文章采用了目标模板和样本概率直方图的方法。计算模板与样本间的海林洛距离(Hellinger Distance),这是一种衡量两个概率分布相似度的度量,用于选择最接近的尺度。这个过程确保了追踪窗口能适应目标尺度的变化,从而提高追踪的准确性。 在OTB-13数据集上的实验结果显示,该算法的追踪成功率达到了0.832,精度为0.899,优于同类深度学习追踪算法,并且平均追踪速度达到42.3 frame/s,满足实时追踪的需求。此外,在包含快速运动或尺度变化的特定追踪序列中,该算法的性能仍然表现出色。 总结来说,这项工作展示了全卷积对称网络在目标尺度自适应追踪问题上的潜力,通过深度学习和多尺度采样策略,实现了对目标快速运动和尺度变化的有效追踪,提高了追踪的稳定性和实时性。这种技术对于视频监控、自动驾驶等需要实时目标追踪的领域具有重要意义。