响应生成与边界框优化的跟踪模型ROAM:性能与收敛加速

0 下载量 63 浏览量 更新于2024-06-20 收藏 1.19MB PDF 举报
本文主要探讨了"跟踪模型优化技术及性能评估"这一主题,针对视觉对象跟踪问题提出了创新的方法。研究者杨天宇和徐鹏飞,以及胡润波、柴华和安东尼·B·陈合作,他们设计了一种集成响应生成和边界框回归的跟踪模型。该模型的核心特点是采用可调整大小的卷积滤波器,能够适应目标形状的变化,避免了对不同大小锚点的枚举,从而减少了模型参数,提高了效率。 文章的亮点在于提出的离线递归神经优化器,它在元学习设置中用于更新跟踪模型。这种优化器能够在几个梯度步骤内收敛,显著提升了模型的收敛速度,确保了在跟踪过程中模型性能的持续优化。这种方法有效地解决了由于目标外观变化导致的传统训练样本可能带来的不准确性和模型退化问题。 作者们将他们的跟踪器命名为ROAM和ROAM++,并在OTB、VOT、LaSOT、GOT-10K和TrackingNet等多个著名的跟踪基准上进行了广泛测试。实验结果显示,相比于最先进的跟踪算法,他们的方法展现出良好的性能,同时兼顾了实时性和精度。 此外,文章还提到了现有方法的一些局限性,如基于学习的判别式和深度连体特征嵌入的跟踪策略,它们在处理长时间跟踪中目标强烈外观变化时面临挑战。传统的模板更新方法虽然可以提高性能,但速度较慢;而手工设计的SGD优化则需要大量迭代,影响实时性。通过对比,作者的方法明显改善了这些问题,为视觉对象跟踪领域的研究提供了新的视角和实用解决方案。