X. Lu,C.马,B。Ni、X.扬岛,智-地里德和MH.
杨
将输入图像的移位版本转换为软标签。通过将相关性计算为傅立叶域
中的逐元素乘积,DCF跟踪器实现了迄今为止最快的速度。许多扩展
包括KCF [31],LCT [32,33],MCF [34],MCPF [35]和BACF [14]。通
过使用深度功能,DCF跟踪器,如DeepSRDCF [1],HDT [2],HCFT
[3],C-COT [4]和ECO [5],在基准数据集上表现出卓越的性能。在[3]
中,Ma et al.提出学习不同卷积层上的多个DCF,并且经验地融合输
出相关图以定位目标对象。在[4]中利用类似的想法来组合多个响应
图。在[5]中,Danelljan et al.减少特征通道以加速学习相关滤波器。尽
管最高性能,DCF跟踪器独立地提取深度特征以学习和更新相关滤波
器。在深度学习时代,DCF跟踪器很难从端到端训练中受益。另一类
代表性的单级跟踪器是基于卷积回归网络的。最近的FCNT [6],STCT
[7]和CREST [8]跟踪器属于这一类。FCNT首次尝试在两个CNN层上学
习回归网络。不同层的输出响应图根据它们的置信度进行切换以定位
目标对象。在STCT中利用集成学习来选择CNN特征通道。CREST [8]
在单个卷积层上学习基础网络和残差网络。融合基础网络和残差网络
的输出图以推断目标位置。我们注意到,当前的深度回归跟踪器的性
能不如DCF跟踪器。我们确定回归学习中的主要瓶颈是数据不平衡问
题。通过平衡训练数据的重要性,单阶段深度回归跟踪器的性能可以
比最先进的DCF跟踪器显着提高。
数据不平衡。
数据不平衡问题在学习社区中得到了广泛的研究[11,
36,37]。有用的解决方案涉及数据重新采样[38-对于视觉跟踪,Li et
al.[44]使用时间采样方案来平衡正样本和负样本,以便于CNN训练。
Bertinetto等人[45]平衡得分图中正负样本的丢失,用于预训练暹罗全卷积
网络。MDNet [26]跟踪器表明
,
在训练分类网络期间挖掘硬负样本至关
重要。最近关于密集对象检测的工作[16]提出了焦点损失,以减少不平
衡样本的损失。尽管重要,但当前的深度回归跟踪器[6-8]很少关注 数
据不平衡在这项工作中,我们建议利用收缩损失惩罚 简单的样本对学
习回归网络的贡献很小。所提出的收缩损失与焦点损失[16]的显著不同之
处在于
,
我们仅对容易样品的损失进行惩罚,同时保持硬样品的损失不
变,而焦点损失也部分减少了硬样品的损失。
3
该算法
我们在一阶段回归框架内开发我们的跟踪器。图2显示了所提出的回归网
络的概述为了促进回归