360°全景图像中的车辆3D检测与单目深度估计：自动驾驶新方案

120 浏览量更新于2024-06-20 收藏 2.05MB PDF 举报

"这篇论文探讨了在全景图像中进行车辆3D检测和单目深度估计的方法，以解决未来自动驾驶汽车面临的挑战。作者来自杜伦大学，他们提出了一种适应360度全景图像的深度网络架构，以克服当前自动驾驶技术中的盲点问题。" 在自动驾驶领域，传统的计算机视觉技术主要关注前向摄像头的处理，但未来的自动驾驶汽车需要全方位的环境感知，就像人类驾驶员一样。因此，研究者开始转向360度全景图像，它们能够提供车辆周围的完整视图。然而，当前的深度网络架构并不适用于这种非标准的全景图像，因此存在一个技术空白。论文中，研究者设计了一种方法，将现代深度网络模型适应到等矩形360全景图像上，同时处理抗模糊和跨域再训练的问题。由于缺乏专门针对全景图像的标注数据集，他们利用样式和投影变换来调整现有的汽车数据集，使其适用于全景图像的算法训练。这种方法使得在没有全景图像训练标签或校准参数的情况下，可以从单目全景图像中恢复场景深度和3D车辆姿态。实验部分，研究者对他们的方法进行了定性和定量评估。他们在公共来源的全景图像上进行了定性分析，并使用汽车环境模拟器创建了第一个基准，以定量评估这种技术在全景图像上的性能。关键词包括物体检测、全景图像、单目3D物体检测、风格转换、单目深度、全景深度和360度深度。 1. 引言部分指出，虽然现有的计算机视觉研究主要集中在前视相机，但360度全景图像对于实现高阶自动驾驶至关重要。目前，对于全景图像的物体检测、分割、立体视觉或深度估计等任务，尚缺乏相应的评估数据集和框架。 2. 论文的贡献在于提出了一种新的方法，能够将现有的深度学习架构应用于全景图像，从而实现3D检测和深度恢复。这种方法有望填补自动驾驶领域的这一关键空白，提高车辆在复杂环境中的感知能力，特别是在缺少全景图像训练数据的情况下。该研究为自动驾驶汽车的全景视觉感知提供了重要的理论和技术支持，对于构建更安全、更全面的自动驾驶系统具有重要意义。通过克服全景图像的处理难题，这一工作为未来的3D对象检测和深度估计研究开辟了新的方向。

G. Payen de La Garanderie，A.Atapour Abarghouei，T.布肯

当代端到端CNN驱动的检测方法基于Girshick [23]引入的R-CNN架构。

Fast-RCNN [22]和Faster-RCNN [51]的连续改进通过在提案中分别共享特征

图并使用区域提案网络（RPN）而不是基于滑动窗口的传统技术生成提

案来提高性能。这允许网络的统一端到端训练，以解决组合检测和分类

任务。最近，Yanget al.

[62]和Caiet al. [6]引入了一种多尺度方法，通过汇集来自多个层的区域

建议，以减少所需的建议数量，并提高对较小对象（如远处对象）的性

能

虽然大多数工作集中在2D检测，但Chen等人的工作

. [9，10]利用

从立体声或L1- DAR模态获得的3D点云信息来生成使用Fast R-CNN修剪

的3D建议。虽然这些作品使用立体视觉，手工制作的功能或3D模型回归

的复杂安排，最近的进展[8，47，7]表明，它实际上是可以恢复的3D姿

态从单眼图像。Chen等人[8]在能量最小化框架内使用建议的后处理，假

设地平面是已知的。Chabot等人[7]使用3D CAD模型作为模板以在给定部

分检测的情况下回归对象的3D姿态;而Mousavian等人[47]示出了可以使用

仔细表达的几何约束在没有任何模板假设的情况下恢复3D姿态。在这项

工作中，我们提出了一种新的方法，类似于[47]，但没有明确表达的几

何约束，它在直线和等矩形全景图像上执行，而不需要任何关于相机的

地平面位置的知识。

2.3

单目深度估计

传统上，密集场景深度使用多视图方法（诸如运动恢复结构和立体视

觉[54]）来恢复，依赖于多个校准视图之间的几何约束然而，最近随

着深度学习的发展，已经表明密集场景深度也可以从单目图像中恢

复。

在基于经典学习的技术（如[52，53]）取得初步成功之后，深度恢

复首先被Lad i ck y 'et al的

dep

作为监督学习问题来处理

。

[

]

并如[15，

43]所示那样应用程序。然而，这些技术是基于高质量的地面实况深

度图的可用性，这是很难获得的。为了打击在地面实况数据问题

上，[1]中的方法依赖于从虚拟环境捕获的容易获得的高分辨率合成深

度图和域转移来解决域偏差的问题。

另一方面，最近出现了能够执行深度恢复而不需要大量地面实况

深度数据的其他单目深度估计方法。Zhou等[64]使用深度和姿态预测

网络来估计单目深度和自我运动，所述深度和姿态预测网络经由

剩余18页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

360°全景图像中的车辆3D检测与单目深度估计：自动驾驶新方案

用于自动驾驶的多视角3D物体检测

3D目标检测 车辆检测 自动驾驶

自动驾驶中的3D目标检测

针孔、鱼眼相机标定，包括单目和双目标定demo

视觉几何经典著作An Invitation to 3D Vision完整版

智能汽车装配-视觉传感器的认知.pptx

cvmi2021.github.io:计算机视觉

深度感知全景分割统一框架：PanopticDepth

图像分析在无人驾驶中的应用：环境感知与路径规划

揭秘OpenCV图像处理实战：从新手到专家的进阶之旅

最新资源

3D目标检测车辆检测自动驾驶