重写”单目图像以获取方式简单,成本低等优势受到了研究者青睐,基于单目图像的3D目标检测算法以成熟的2D目标检测算法为基础,实现了2D图像中目标的定位和分类。2016年,Chen 等人提出了Mono3D[4]目标检测方法,该方法利用 Faster R-CNN提取特征,结合上下文信息、位置先验信息和目标形状先验信息等,计算出检测框的总损失函数,来提取精确的目标三维检测框。但是在计算损失函数中存在误差累计的问题,导致Mono3D的精度不是非常优越。2019年Brazil等人提出的M3D-RPN[5]使用单一整体的网络进行3D目标检测,并设计了深度感知(depth-aware)卷积层来增强对三维场景的理解,学习空间特征,对提升目标检测的精度有很大作用。2020年,Li等人受CenterNet[6]启发提出RTM3D[7],把目标检测看作关键点检测,在空间估计出目标的尺寸、位置和大致方向,成为了首个仅使用单目图像进行实时检测的算法。”要求不要看起来像记流水账,要注意前后的逻辑,并添加至少3个2021-2023年的最新工作
时间: 2023-03-06 11:07:59 浏览: 145
基于指数-余弦离散混沌映射的图像加密算法研究.docx
单目图像具有简单获取、低成本等优势,使得研究者青睐其进行3D目标检测。2016年,Chen等人提出了Mono3D[4]目标检测方法,利用Faster R-CNN提取特征,结合上下文信息、位置先验信息和目标形状先验信息等,计算出检测框的总损失函数以提取准确的三维检测框,但是在计算损失函数中存在误差累计的问题。2019年Brazil等人提出的M3D-RPN[5]使用单一整体的网络,并设计了深度感知(depth-aware)卷积层来增强对三维场景的理解,从而提升了目标检测的精度。2020年,Li等人受CenterNet[6]启发提出RTM3D[7],把目标检测看作关键点检测,通过估计出目标的尺寸、位置和大致方向,实现仅使用单目图像进行实时检测的算法。自那之后,2021-2023年有不少类似的研究,比如VoxelNet[8]利用立体Voxel卷积神经网络提取特征,提供了一种立体特征表示;YOLO-3D[9]基于YOLOv3框架,利用卷积网络从单目图像中检测出三维物体的位置和尺寸信息;MVPNet[10]利用多视角特征表示提取更多的空间信息,实现了较高的三维物体检测精度,以及多种其他的改进算法,都取得了不错的结果。
阅读全文