自动驾驶中的3D目标定位与相机运动估计：基于立体视觉的新方法

198 浏览量更新于2024-06-20 收藏 1.66MB PDF 举报

"基于立体视觉的自主驾驶中的3D动态目标定位和相机自运动估计" 在自动驾驶技术中，准确地定位3D动态目标并估计相机的自我运动是至关重要的。这篇论文提出了一种创新的方法，它针对的是当前3D对象检测和视觉SLAM方法在自动驾驶场景中的局限性。传统的端到端3D对象检测方法需要大量标注数据，而SLAM方法可能无法很好地处理动态环境。为了解决这些问题，研究者们从香港科技大学提出了一个基于立体视觉的方案。首先，他们放弃了直接的3D包围盒回归，而是采用易于获取的2D对象检测结果和离散视角分类。这种方法降低了训练数据的需求，只需要2D图像标注即可。通过结合2D信息和轻量级的语义推理，他们能够获得粗略的3D对象测量，这有助于解决实例3D检测的帧间不一致性问题。接着，为了实现连续的3D目标定位和相机位姿跟踪，研究者们提出了一种动态目标光束平差（BA）方法，该方法结合了目标感知辅助的相机位姿跟踪。此方法对动态环境有较强的鲁棒性，并能估计出具有实例精度和时间一致性的三维目标位置、速度以及动态点云的锚定点。此外，他们还引入了一个语义三维测量模型，进一步增强了定位和运动估计的准确性。整个系统的性能在各种情况下得到了验证，包括自我运动估计和对象定位，与现有的先进解决方案进行了比较，显示了其优越性。关键词如语义SLAM（语义同步定位与建图）、三维目标定位和视觉里程计强调了研究的核心内容。语义SLAM允许系统理解环境的语义信息，而三维目标定位则是为了精确地识别和跟踪移动的物体。视觉里程计则负责估计相机在连续帧间的运动，这对自动驾驶车辆的导航至关重要。论文中提到的系统在长期的行驶历史中可以跟踪相机和所有物体的3D轨迹，并能在极端情况下（如汽车被截断）保持准确的跟踪能力。通过立体特征匹配和动态3D稀疏特征恢复，系统能够在复杂环境中实现一致的运动和方向估计。这项工作为自动驾驶领域的3D目标定位和相机运动估计提供了一个有效且实用的新方法，解决了当前方法的一些关键挑战，提高了自动驾驶的安全性和可靠性。

P. Li

，

T. Qin

和

沈

视点分类与三维框推理

特征提取和匹配

自我运动与目标跟踪

对象时态关联

背景特征

ROI池

对象特征语义

信息运动模型

摄像机姿态

对象BA

摄像头BA

3D框推理

对象轮廓和遮挡蒙版

生成

Viewpoint Softmax

2D Box回归

Conv层

ORB特征提取

特征时间和立体匹

配

(a) 节4（b）5（c）6

图二.我们的整个语义追踪系统架构。

框几何约束用于计算3D对象姿态，而纯粹

依赖于实例

框限制了其在对象截断

情况下的性能。

在这项工作中，我们研究了现有工作的利弊，并提出了一个

集成

的感知解决方案，充分利用实例语义先验和精确的特征时空对应关系，以

实现对自

我相机和

静态或动态对象。

概述

我们的语义跟踪系统有三个主要模块，如图所示二、

第一个模块执行

对象检

测和视点分类（第

节），其中基于

2D框边缘和3D框顶点之间的约束粗略地推断

对象姿态。第二模块是特征提取和匹配（Sect.（五）。它将所有推断的3D框

投影到

图像以获得对象轮廓和遮挡遮罩。引导特征匹配，然后应用到获得强

大的立体和时间图像的特征关联

在第三模块（

Sect.6

），我们将所有的语义信

息，特征测量集成到一个紧密耦合的优化方法。运动学模型

被附加地应用于汽车以

获得一致的运动估计。

视点分类与三维框推理

我们的语义测量包括

对象框和分类的观点。

基于此，可以以闭合形式立即粗略

地推断对象姿态

剩余15页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

自动驾驶中的3D目标定位与相机运动估计：基于立体视觉的新方法

基于单目视觉的运动目标跟踪定位技术研究

基于视觉显著性的车载单目相机自运动估计及前车尺度估计方法.docx

基于立体视觉测量的移动机器人导航技术研究

基于相机的3D车辆目标检测建议使用哪种算法

基于SLAM的双目立体视觉实时自校准

帮我写一段介绍基于单目/立体图像的3D目标检测方法的发展（用文献的形式呈现出其一步步发展点）要求具备全面详细概括性、关键重要性

帮我写一段基于单目/立体图像的3D目标检测方法的综述

相机标定、三维重建、3d视觉定位

matlab立体视觉里程计

立体视觉同步定位和映射matlab代码

最新资源