GNN3DMOT:融合2D-3D特征的3D MOT跟踪新方法

PDF格式 | 1.8MB | 更新于2025-01-16 | 109 浏览量 | 0 下载量 举报
收藏
3D MOT(三维多目标跟踪)是自动驾驶和其他自主导航系统中至关重要的技术,它涉及实时跟踪多个目标在三维空间中的动态。当前的方法通常采用传统的跟踪检测流程,首先由2D或3D特征提取器对目标进行独立特征提取,形成各自对象的特征表示,接着计算亲和矩阵来衡量对象间的相似度,最后利用匈牙利算法进行数据关联。 然而,这种标准方法存在一个问题,即单靠独立的特征提取可能不足以捕捉对象之间的显著差异,特别是对于外观和运动特征的区分。为此,本文提出了两项创新: 1. **GNN3DMOT:图形神经网络应用于3D MOT** - 作者引入了图神经网络(GNN)作为新的特征交互机制,允许一个对象的特征在与其他对象互动后,根据它们的相似性和差异性调整其特征向量。这种机制有助于增强特征的区分度,使对象特征更倾向于具有相同ID的对象,同时与不同ID的对象区分开来,从而提升数据关联的准确性。 2. **2D-3D联合特征提取器** - 为了更好地融合二维和三维空间的信息,文章设计了一种新型的特征提取器,能够同时学习物体的外观和运动特性。考虑到不同模态的特征互补性,这种联合特征提取器能够提供更具区分性的特征表示,避免了单一模态的限制。 为了确保联合特征提取器的鲁棒性,作者还提出了一个集成训练范式,以平衡不同模态信息的贡献,防止过度依赖某一种特征。 这些创新方法在KITTI和nuScenes 3DMOT基准测试中取得了最先进的性能,展示了在复杂场景中3D MOT任务中引入深度学习和多模态特征融合的优势。研究者们在GitHub上提供了相关的代码实现,便于其他研究者进一步探索和改进3D MOT技术:<https://github.com/xinshuoweng/GNN3DMOT>。 总结来说,这篇论文的核心贡献在于革新了3D MOT的数据关联过程,通过图形神经网络和联合特征提取器提高了对象特征的表达能力和区分度,从而提升了3D多目标跟踪的性能。

相关推荐