TrackingNet：大规模野外目标跟踪数据集与基准

41 浏览量更新于2024-06-20 收藏 2.63MB PDF 举报

"TrackingNet是一个大型野外目标跟踪数据集和基准，包含超过30,000个视频，总共1400万个边界框注释，旨在推动深度学习在对象跟踪领域的进步。它提供了多样化的背景和各类目标，还包含一个用于公平评估的新基准测试集，由500个视频组成。通过在线评估服务器，研究人员可以衡量跟踪器的性能。对深度跟踪器进行微调后，其在OTB100和TrackingNet测试集上的性能分别提升了1.6%和1.7%。" 文章详细讨论了TrackingNet数据集的重要性和它在对象跟踪领域的贡献。传统的对象跟踪任务虽然取得了一定的进步，但仍然面临挑战，尤其是当面临现实世界中的复杂环境和大量未见过的场景时。现有的小规模数据集，如OTB和VOT，无法充分模拟这些挑战。 TrackingNet的出现解决了这个问题，它是一个专为深度学习设计的大规模数据集，可以满足数据驱动的方法对大量标注数据的需求。每个视频中的边界框注释使得模型能够学习到更多的跟踪模式和场景变化。此外，数据集覆盖了广泛的目标类别和背景，增加了模型泛化能力的训练机会。为了促进公平比较和推动未来研究，TrackingNet不仅提供了大规模的训练数据，还创建了一个独立的500个视频组成的测试集，其分布与训练数据相似。这种分离确保了评估结果的公正性。此外，设立的在线评估服务器让研究者能够方便地测量和比较他们的跟踪算法性能。基准测试显示，通过在TrackingNet上微调的深度跟踪器在OTB100和TrackingNet自己的测试集上都实现了显著的性能提升，这证明了这个大型数据集对于提升跟踪算法的泛化能力和实战效果的有效性。然而，尽管有这些改进，TrackingNet的广泛基准测试也揭示了对象跟踪问题尚未完全解决，表明这个领域仍有许多研究空间待探索。关键词涉及对象跟踪、数据集、基准测试和深度学习，强调了TrackingNet在这些关键领域的贡献。这个数据集和基准为计算机视觉社区提供了一个强大的工具，以推动对象跟踪技术在复杂现实世界环境中的进步。

Müll

r，

，

ian

、

NEM

具体的在线方式。MDNET [38]通过赢得VOT15 [24]挑战展示了这种方

法的成功第二种方法包括训练一个完全卷积的网络，并在跟踪过程中

使用特征图选择方法在浅层和深层之间进行选择[47]。我们的目标是

找到一个很好的权衡一般语义和更具体的歧视性的功能，以及，以消

除嘈杂和不相关的特征图。

虽然这两种方法都实现了最先进的结果，但它们的计算成本阻止

了这些算法在实际应用中的部署第三种方法包括使用预测连续帧之间

的运动的连体网络。这种跟踪器通常使用深度回归[15]或CNN匹配函

数[2，45，13]在大规模数据集上进行离线训练。由于其简单的架构和

缺乏在线微调，只有一个正向传递必须在测试时执行。这会导致非常

快的运行时间（up 在GPU上达到100fps），同时实现具有竞争力的

精度。然而，由于模型在测试时不更新，因此准确性高度依赖于训练

数据集在跟踪各种对象时捕获外观滋扰这种方法将受益于我们在本文

中提出的大规模数据集。

对象跟踪数据集。许多数据集可用于对象跟踪，最常见的是用于单对

象跟踪的OTB [49]，VOT [25]，ALOV300 [43]和TC128 [33]以及用于多

对象跟踪的MOT [28，35]。VIVID [5]是建立用于监视目的的跟踪数据

集的早期尝试。OTB50 [48]和OTB100 [49]提供51和98个视频序列，每

个帧用11个不同的属性和直立边界框表示。TC128 [33]包括129个视

频，基于相似的属性和直立的绑定框。AL0V300 [43]包括用14个属性

标记的314个视频序列。VOT [25]提出了多达60个视频序列的几个挑战

它引入了旋转的边界框以及对对象跟踪注释的广泛研究。VOT-TIR是

VOT的一个特定数据集，专注于热红外视频。NUS PRO [29]收集了一

个特定于应用程序的365视频集合，UAV123和UAV20L [36]收集了另

一个特定于应用的123个视频和20个从无人机捕获或从飞行模拟器生

成的长视频集合NfS [11]提供了一组100个高帧率的视频，试图专注于

快速运动。表1提供了最流行的跟踪数据集的详细概述。

尽管有几个数据集可用于对象跟踪，但大规模数据集对于训练深

度跟踪器是必要的。因此，目前深轨- ER依赖于对象检测数据集，

如ImageNet Video [42]或Youtube- BoundingBoxes [40]。这些数据集提供

视频上的对象检测边界框，在时间上相对稀疏或以低帧速率。因此，

它们缺乏关于连续帧中的对象动态的运动信息尽管如此，它们仍被广

泛用于预训练深度跟踪器。它们提供了具有对象知识的深度特征表

示，可以将其从检测转移到跟踪。

剩余17页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

TrackingNet：大规模野外目标跟踪数据集与基准

深度学习之目标检测数据集：野外着火烟雾图像目标检测数据集(1分类)（YOLO标注格式的txt文件）

TrackingNet-devkit:TrackingNet开发套件

YOLOV5 实战项目：野外着火烟雾图像目标检测数据集

yolo兔子种类数据集

无人机多目标跟踪识别的研究意义

农业病虫害研究数据集

mushroom classification 数据集

CarnivorousDiets 肉食动物饮食数据集

遥感野外实习的意义和目的

rtdert训练自己的数据集

最新资源