干扰感知暹罗网络：提升视觉目标跟踪的鲁棒性

162 浏览量更新于2024-06-20 收藏 1.16MB PDF 举报

"这篇文章主要探讨了视觉目标跟踪中面临的问题，特别是如何处理干扰子的影响，提出了干扰子感知连体网络的解决方案。文章介绍了暹罗网络在视觉跟踪领域的应用，但指出传统的特征区分方法可能无法有效应对空间背景干扰，导致跟踪器的鲁棒性降低。作者提出了一种新的策略，通过在训练阶段采用分布控制策略来增强特征的区分性，并在推理阶段设计了增量学习模块，适应视频中的变化。此外，还引入了局部到全局搜索区域策略，以提高长期跟踪的性能。实验结果显示，这种方法在多个数据集上显著优于现有技术，同时保持了较高的运行速度。" 正文: 视觉目标跟踪是计算机视觉领域的一个关键任务，涉及在复杂动态环境中持续定位和识别目标。近年来，暹罗网络因其在准确性和实时性之间的平衡表现，成为解决这个问题的一种流行方法。暹罗网络基于深度学习框架，通过比较目标模板与视频帧中的候选区域来判断目标是否存在。然而，尽管暹罗网络取得了显著的成果，但它们通常忽视了一个重要的问题，即空间背景中的干扰子（如运动背景或相似物体）对跟踪性能的影响。这些干扰子会混淆网络，降低其区分目标与非目标区域的能力，从而影响跟踪的准确性与鲁棒性。针对这一挑战，文章提出了一种干扰子感知连体网络，其核心在于学习能够识别和区分干扰子的特征。为了提高特征的区分性，研究者在训练阶段采用了有效的采样策略，平衡训练数据的分布，使模型能够专注于学习语义干扰项的特征。这种分布控制策略有助于模型更好地理解并忽略不相关的背景元素。在推理阶段，文章引入了一个增量学习模块，允许网络根据当前视频帧的上下文信息动态调整其表示。这种增量学习方法使得模型能够适应视频流中的视觉变化，从而实现更准确和长期的跟踪。此外，为了增强长期跟踪能力，研究人员设计了一个局部到全局的搜索策略。这个策略扩大了搜索范围，考虑了目标可能的移动范围，减少了因目标暂时离开视线而导致的跟踪丢失。实验部分展示了所提方法在VOT2016和UAV20L数据集上的卓越性能，相对增益分别为9.6%和35.9%，证明了该方法的有效性。而且，该跟踪器在短期和长期基准测试中都保持了高效的速度，分别达到了160FPS和110FPS。这篇论文通过干扰子感知连体网络和相关策略，为视觉目标跟踪提供了新的视角，不仅提高了跟踪的准确性，还增强了模型对环境变化的适应性。这些创新对视觉跟踪领域的发展具有重要启示，可能对未来的研究和应用产生深远影响。

Zheng Zhu，Qiang Wang，Bo Li，Wei Wu，Junjie Yan and

Weiming Hu

ply使用运行时固定但学习先验深度暹罗相似性函数来搜索与起始帧

作为后续工作，Bertinetto et.al [2]提出了一个完全卷积的Siamese网络

（SiamFC）来估计两帧之间的特征相似性区域。RASNet [36]通过使用

剩余注意力网络学习注意力机制来推进这种相似性度量。与SiamFC和

RASNet不同，在GOTURN跟踪器[8]中，使用深度回归网络预测连续

帧之间的运动这三个跟踪器能够在GPU上分别以86 FPS，83FPS和100

FPS执行，因为没有在线进行微调。CFNet [33]将相关滤波器解释为

Siamese跟踪框架中的但与SiamFC相比，性能的提高有限。FlowTrack

[40]利用Siamese架构中的运动信息来提高特征表示和跟踪精度。值得

注意的是，CFNet和FlowTrack可以高效地在线更新跟踪模型。最近，

SiamRPN [16]通过在Siamese网络之后引入区域建议网络，将跟踪制定

为一次性本地检测任务，该网络通过大规模图像对进行端到端离线训

练。

跟踪功能。视觉特征在包括视觉跟踪在内的计算机视觉任务中起着重

要作用。Possegger et.al [26]提出了一个干扰感知模型项来抑制视觉上

分散注意力的区域，而在其框架中使用的颜色直方图特征不如深度特

征鲁棒。DLT [35]是开创性的深度学习跟踪器，它使用多层自动编码

器网络。该特征以无监督的方式在80M Tiny Image数据集[32]的一部分

上进行预训练。Wang等人。[34]在视频库上学习一个两层神经网络，

其中对特征学习施加了时间上的慢度约束DeepTrack [17]从二进制样本

中学习两层CNN分类器，不需要预训练过程。UCT [39]将特征学习和

跟踪过程制定为统一的框架，使学习的特征与跟踪过程紧密耦合。

长期跟踪。传统的长期跟踪框架可以分为两组：早期的方法将跟踪视

为与几何模型匹配的局部关键点描述符[25，24，21]，而最近的方法

通过将短期跟踪器与检测器相结合来执行长期跟踪。后一类的开创性

工作是TLD [10]，它提出了一个无记忆的流群作为短期跟踪器和并行

运行的基于模板的检测器。Ma等人。[20]提出了KCF跟踪器和随机蕨

类分类器的组合作为用于校正跟踪器的检测器同样，MUSTER [9]是

一个长期跟踪框架，它将KCF跟踪器与基于SIFT的检测器相结合，该

检测器也用于检测遮挡。Fan和Ling [6]将DSST跟踪器[4]与CNN检测器

[31]相结合，该检测器验证并可能纠正短期跟踪器的建议。

剩余16页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

干扰感知暹罗网络：提升视觉目标跟踪的鲁棒性

Python-用于物体跟踪的全卷积连体网络SiameseFC的Pytorch实现

matlabfilter代码-siam:暹

用于室内视觉导航的多状态连体网络

用devc++写连体数独

连体数独游戏c语言代码

如何用python计算六连体密码子对的使用频率

Sentence-BERT

Sentence-BERT 优势

transformer基于像素级的变化检测

基于纯transformer的遥感影像变化检测

最新资源