MOTR：Transformer在多目标跟踪中的时域建模新方法

43 浏览量更新于2024-06-19 收藏 1.24MB PDF 举报

"MOTR: Transformer-based End-to-end Multi-object Tracking with Temporal Modeling" 本文主要探讨了多目标跟踪（MOT）中的一个重要问题——时域建模，并提出了一种名为MOTR的新方法。MOTR是针对现有技术的一个改进，尤其是针对那些将运动和外观建模分开的方法。传统方法通常依赖于运动和外观的相似性算法来关联目标，但这种后处理方式限制了系统利用视频序列中时间变化的能力。 MOTR借鉴了DETR（DEtection TRansformer）的设计，DETR是一个用于端到端物体检测的Transformer架构。MOTR对DETR进行了扩展，引入了“跟踪查询”（Tracking Queries），这些查询能够跨帧传输和更新，以持续迭代预测跟踪实例。通过这种方式，MOTR能够更好地捕捉时间上的连续性。文章中还提出了跟踪感知标签分配（Tracking-aware Label Assignment）和新生对象查询（Novel Object Queries），这两者旨在更精确地追踪新出现或消失的目标。此外，时间聚集网络（Temporal Aggregation Network）和集体平均损失（Collective Average Loss）进一步强化了对时间关系的建模，从而提高跟踪性能。实验结果显示，MOTR在DanceTrack数据集上相对于最先进的方法ByteTrack有了显著的提升，特别是在HOTA（Higher Order Association）度量上，提升了6.5%。在MOT17数据集上，MOTR在关联性方面也超越了TrackFormer和TransTrack等同类工作。MOTR不仅在性能上表现出色，而且作为一个更强大的基线，为未来的时间建模和基于Transformer的跟踪器研究提供了基础。关键词涉及多目标跟踪、Transformer架构以及端到端方法，强调了MOTR在解决MOT问题时的创新之处。源代码可以在https://github.com/megvii-research/MOTR上获取，为研究者和开发者提供了实践和改进的基础。 MOTR通过端到端的框架整合了运动和外观信息，引入了跟踪查询和时间建模策略，显著提升了多目标跟踪的效率和准确性，为Transformer在MOT领域的应用开辟了新的道路。

+v：mala2255获取更多论

文

4楼。Zeng等

特征学习TransMOT [8]构建了一个时空图Transformer来进行关联。我

们的并行工作，TransTrack [29]和TrackFormer [18]也为MOT开发了基于

Transformer的框架。如需与它们进行直接比较，请参阅第三点七

迭代序列预测。通过

编码器-解码器架构的序列到序列（seq 2seq）预测序

列在机器翻译[30，31]和文本识别[25]中很流行。在seq2seq框架中，编码

器网络将输入编码为中间表示。然后，引入具有任务特定上下文信息的

隐藏状态，并通过解码器网络与中间表示迭代交互以生成目标序列。迭

代解码过程包含若干迭代。在每次迭代中，隐藏状态解码目标序列的

一个元素

方法

3.1 目标检测

DETR [6]引入了一组固定长度的对象查询来检测对象。对象查询被馈

送到Transformer解码器中，并与从Transformer编码器中提取的图像特

征交互，以更新其表示。进一步采用二分匹配来实现更新的对象查询

和地面实况之间的一对一分配在这里，我们简单地将对象查询写为

3.2 检测查询和跟踪查询

当将DETR从目标检测调整为MOT时，会出现两个主要问题

1)如何通过一个跟踪查询来跟踪一个对象; 2）如何处理新生对象和终

止对象。在本文中，我们扩展检测查询跟踪查询。航迹查询集是动态

更新的，长度可变.如图2所示，跟踪查询集被初始化为空，并且

DETR中的检测查询被用于检测新生对象（在

处的对象3）。检测到

的对象的隐藏状态产生下一帧的跟踪查询;分配给终止对象的跟踪查

询从跟踪查询集中删除（

处的对象2）。

3.3

Tracklet感知标签分配

在DETR中，一个检测（对象）查询可以被分配给图像中的任何对

象，因为标签分配是通过在所有检测查询和地面实况之间执行二分匹

配来确定的。而在MOTR中，检测查询仅用于检测新生对象，而跟踪

查询预测所有跟踪对象。在这里，我们引入了tracklet感知标签分配

（TALA）来解决这个问题。

一般来说，TALA由两种策略组成对于检测查询，我们将DETR中

的分配策略修改为

仅限新查询

，其中二分匹配是

剩余16页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

MOTR：Transformer在多目标跟踪中的时域建模新方法

位置随动系统建模与时域特性分析.pdf

基于深度学习的多目标跟踪关联模型设计.docx

目标跟踪综述.pptx

基于量测补偿的多传感器分布式滚动时域估计.pdf

卡车目标遮挡建模和微多普勒分析的新方法

具有融合罚约束的低秩结构化稀疏表示目标跟踪算法

滚动时域优化（RHC）MATLAB源代码

自动控制原理实验报告二阶系统时域分析.doc

一种基于宽带MIMO雷达时域成像的阵列布阵模型

电源技术中的单相UPF Boost PWM转换器瞬态建模分析

最新资源