深度回归跟踪器：收缩损失与性能提升

162 浏览量更新于2024-06-20 收藏 1.3MB PDF 举报

"这篇论文探讨了深度回归跟踪器在目标跟踪任务中的应用，尤其是在面对数据不平衡问题时的挑战。文章提出了收缩损失的概念，这是一种新的损失函数，旨在解决训练过程中的前景-背景数据不平衡，从而提高深度回归跟踪器的性能。此外，通过引入残差连接，该方法能够更好地融合多层卷积的输出，进一步提升跟踪效果。实验结果显示，这种方法在多个基准数据集上的表现优于其他先进的深度回归跟踪器，并且与传统的DCF跟踪器相比也有显著优势。" 深度回归跟踪器是近年来在视觉对象跟踪领域中备受关注的一种方法。与传统的两阶段检测跟踪器不同，它们直接学习目标位置的估计，通过密集采样并利用回归网络进行预测。这种一阶段的方法由于其高效性和简洁性，被广泛研究和采用。然而，深度回归跟踪器的一个主要问题是数据不平衡，即目标区域的样本数量远远少于背景区域的样本，这在训练过程中会导致网络对背景的过拟合，从而影响跟踪精度。为了解决这个问题，论文提出了一种名为“收缩损失”的新损失函数。收缩损失通过惩罚那些容易区分的训练样本，使得网络更加重视难分样本的学习，从而达到数据平衡的效果。此外，论文还采用了残差连接来改进网络结构。残差连接允许信息直接跨层传递，使得网络能更有效地融合不同层的特征，提高响应映射的质量。这一设计有助于捕捉更复杂的视觉模式，从而提升跟踪的鲁棒性和准确性。实验部分，论文在多个标准数据集上对比了所提出的跟踪算法与其他先进跟踪器，如CREST、C-COT、ECO和HCFT等，结果表明，新方法在0TB-2013、0TB-2015、Temple-128、UAV-123和VOT-2016这些基准上都表现出色，特别是在与DCF跟踪器的比较中，显示出了深度回归网络的端到端训练优势。这篇论文通过收缩损失和残差连接的结合，提升了深度回归跟踪器在应对数据不平衡问题时的能力，为视觉对象跟踪领域提供了一种有效且实用的解决方案。这表明，在深度学习技术的驱动下，未来的目标跟踪算法有望实现更高的准确性和实时性。

X. Lu，C.马，B。Ni、X.扬岛，智-地里德和MH.

杨

将输入图像的移位版本转换为软标签。通过将相关性计算为傅立叶域

中的逐元素乘积，DCF跟踪器实现了迄今为止最快的速度。许多扩展

包括KCF [31]，LCT [32，33]，MCF [34]，MCPF [35]和BACF [14]。通

过使用深度功能，DCF跟踪器，如DeepSRDCF [1]，HDT [2]，HCFT

[3]，C-COT [4]和ECO [5]，在基准数据集上表现出卓越的性能。在[3]

中，Ma et al.提出学习不同卷积层上的多个DCF，并且经验地融合输

出相关图以定位目标对象。在[4]中利用类似的想法来组合多个响应

图。在[5]中，Danelljan et al.减少特征通道以加速学习相关滤波器。尽

管最高性能，DCF跟踪器独立地提取深度特征以学习和更新相关滤波

器。在深度学习时代，DCF跟踪器很难从端到端训练中受益。另一类

代表性的单级跟踪器是基于卷积回归网络的。最近的FCNT [6]，STCT

[7]和CREST [8]跟踪器属于这一类。FCNT首次尝试在两个CNN层上学

习回归网络。不同层的输出响应图根据它们的置信度进行切换以定位

目标对象。在STCT中利用集成学习来选择CNN特征通道。CREST [8]

在单个卷积层上学习基础网络和残差网络。融合基础网络和残差网络

的输出图以推断目标位置。我们注意到，当前的深度回归跟踪器的性

能不如DCF跟踪器。我们确定回归学习中的主要瓶颈是数据不平衡问

题。通过平衡训练数据的重要性，单阶段深度回归跟踪器的性能可以

比最先进的DCF跟踪器显着提高。

数据不平衡。

数据不平衡问题在学习社区中得到了广泛的研究[11，

36，37]。有用的解决方案涉及数据重新采样[38-对于视觉跟踪，Li et

al.[44]使用时间采样方案来平衡正样本和负样本，以便于CNN训练。

Bertinetto等人[45]平衡得分图中正负样本的丢失，用于预训练暹罗全卷积

网络。MDNet [26]跟踪器表明

，

在训练分类网络期间挖掘硬负样本至关

重要。最近关于密集对象检测的工作[16]提出了焦点损失，以减少不平

衡样本的损失。尽管重要，但当前的深度回归跟踪器[6-8]很少关注数

据不平衡在这项工作中，我们建议利用收缩损失惩罚简单的样本对学

习回归网络的贡献很小。所提出的收缩损失与焦点损失[16]的显著不同之

处在于

，

我们仅对容易样品的损失进行惩罚，同时保持硬样品的损失不

变，而焦点损失也部分减少了硬样品的损失。

该算法

我们在一阶段回归框架内开发我们的跟踪器。图2显示了所提出的回归网

络的概述为了促进回归

剩余18页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

深度回归跟踪器：收缩损失与性能提升

【深度分析】：探索MapReduce task数目对集群性能的神秘影响

揭秘语义分割的奥秘：深度解析算法、挑战与机遇

深度学习在医疗影像分析中的应用：面对挑战的策略

【神经架构搜索（NAS）】：深度学习超参数调优的未来

【AI透明度揭秘】：如何构建可解释的深度学习模型并提升企业合规性

L2正则化的性能优化：算法加速与内存管理技巧

【青藤云安全产品性能调优】：提升检测效率的3大关键策略

【XKT-412规格书环境适应性秘籍】：揭秘如何在极端条件下保持系统性能（环境测试与优化要点）

环境影响因素分析：汽车电连接器试验的关键考量

求解器在计算机视觉中的运用：赋能图像和视频分析，解锁视觉洞察

最新资源