响应生成与边界框优化的跟踪模型ROAM：性能与收敛加速

63 浏览量更新于2024-06-20 收藏 1.19MB PDF 举报

本文主要探讨了"跟踪模型优化技术及性能评估"这一主题，针对视觉对象跟踪问题提出了创新的方法。研究者杨天宇和徐鹏飞，以及胡润波、柴华和安东尼·B·陈合作，他们设计了一种集成响应生成和边界框回归的跟踪模型。该模型的核心特点是采用可调整大小的卷积滤波器，能够适应目标形状的变化，避免了对不同大小锚点的枚举，从而减少了模型参数，提高了效率。文章的亮点在于提出的离线递归神经优化器，它在元学习设置中用于更新跟踪模型。这种优化器能够在几个梯度步骤内收敛，显著提升了模型的收敛速度，确保了在跟踪过程中模型性能的持续优化。这种方法有效地解决了由于目标外观变化导致的传统训练样本可能带来的不准确性和模型退化问题。作者们将他们的跟踪器命名为ROAM和ROAM++，并在OTB、VOT、LaSOT、GOT-10K和TrackingNet等多个著名的跟踪基准上进行了广泛测试。实验结果显示，相比于最先进的跟踪算法，他们的方法展现出良好的性能，同时兼顾了实时性和精度。此外，文章还提到了现有方法的一些局限性，如基于学习的判别式和深度连体特征嵌入的跟踪策略，它们在处理长时间跟踪中目标强烈外观变化时面临挑战。传统的模板更新方法虽然可以提高性能，但速度较慢；而手工设计的SGD优化则需要大量迭代，影响实时性。通过对比，作者的方法明显改善了这些问题，为视觉对象跟踪领域的研究提供了新的视角和实用解决方案。

6720

⌈

⌉

（

t−1

）

Meta损失

帧

特征提取器

跟踪模型

预测

标签

特征

F ... F...F

（

−

）

（

−

）

（

−

）

更新损失

历史帧

reg

（

−

1）

（

−

）

我

... B

未来帧

特征

（

）

（

）

温度

范

围

（

）

温度

范

围

（

）

reg

（t

δ）

（

t+δ

）

图1：ROAM++的管道给定一小批训练块，这些训练块基于预测的对象框进行裁剪，提取深度特征

作者：

Featur eExt r actor.

固定

大小的

跟踪模型

（

）

被收缩到当前目标大小，

产生

收缩

的

跟踪模型

（

）

，如（

，

）中所示。

然后使用

（

−

）

预测每个样本

的

响应

图和边界框

，

使用地面真值标签计算

更新损失

（

−

）

及其梯度

（

−

）

接下来，将由先前的学习率、当前参数、

当前更新损失及其梯度组成的按元素的堆栈I（t-1）输入到按坐标的LSTM O中，以生成如（11）中的自适应学习率

（

-1

）。然后，使用一个

梯度下降步骤（由f表示）来更新模型，如（9）中所示。最后，我们在随机选择的未来帧上应用更新的模型θ

（

）

，以获得如（13）中的最小化

的Meta损失。

在跟踪过程中，目标的期望比不发生变化，但这经常

被违反。因此，动态地使卷积滤波器适应对象形状变

化是期望的，这意味着滤波器参数的数量可以在视频

中的帧之间以及在不同序列之间变化。然而，当为每

个滤波器使用单独的学习率时，这使神经优化器的设

计复杂化

其中，使用双线性插值将卷积滤波器的大小调整

为

（

，

）。滤波器大小根据先前图像块中的对

象的宽度和高度（

，

）来计算（并且对于对称

性，滤波器大小是奇数），

ρh ρh

−c

mod 2

，

（

）

参数.为了简化元学习框架并更好地考虑每个参数的学

习率，我们定义了

ρw

以2

1方式调

整的方案（

）

- 固定形状的卷积滤波器，其在与特征图进行卷积之前

使用双线性插值被扭曲到期望的目标大小。在后续帧

中，循环优化器更新固定形状跟踪模型。请注意，

MetaTracker [34]也会调整滤波器的大小以适应模型初

始化的对象大小，然而，MetaTracker在后续帧中保持

与初始滤波器相同的形状，而不是动态地将卷积滤波

器调整为后续帧的对象大小

具体地，跟踪模型

包含两个部分，即相关滤波

器

和边界框回归滤波器

reg

。它们都被扭曲以适

应目标的形状变化

[

，

]

，

（

）

其中ρ是用于扩大滤波器大小以覆盖一些上下文信息的

比例因子，并且c是特征图的步幅由于可调整大小的过

滤器，在执行边界框回归时，不需要枚举锚框的不同

纵横比和尺度。我们只在每个空间位置上使用一个大

小的锚点，其大小对应于回归滤波器的形状

（

，

）

（

，

）

/ρ

，

（

）

这节省了回归滤波器参数，并实现了更快的速度。注

意，我们每τ帧更新滤波器大小及其对应的锚框，即，

在每次模型更新之前，在离线训练和测试/跟踪阶段。

通过这种修改，我们可以初始化-

（θ

=W（θ

，

φ）

，

（

）

，

φ）

，

（

）

...

我

... M

（

t−1

）

（

t−

（

吨

）

CNN

reg

剩余14页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

响应生成与边界框优化的跟踪模型ROAM：性能与收敛加速

单模型机动目标跟踪算法的仿真研究

Node性能跟踪与稳定性优化

深度回归跟踪器的收缩损失及性能评估

实时3D模型颜色和深度跟踪在单CPU内核上的性能优化

如何在磁链观测器C算法中进行模型评估与性能优化

YOLOv5性能评估指南：深入理解指标，优化模型表现

最大功率点跟踪的独立光伏(pv)电站建模和性能评估

多输入单输出模型预测控制的优化性能指标怎么表示

优化模型的优点、缺点、推广

如何训练rtdetr模型

最新资源