3D目标检测新突破:焦点稀疏卷积网络

PDF格式 | 15.58MB | 更新于2025-01-16 | 139 浏览量 | 1 下载量 举报
收藏
"这篇论文介绍了焦点稀疏卷积网络(Focals Conv)在3D目标检测中的应用,强调了可学习的空间稀疏性对于处理非均匀3D稀疏数据的重要性。作者通过引入Focals Conv和Focals Conv-F模块,增强了稀疏CNNs的能力,这两个模块基于位置重要性预测,使特征稀疏性可学习。实验结果表明,这种方法在KITTI、nuScenes和Waymo基准测试上表现优越,特别是在nuScenes测试基准上超越了所有现有单模型的记录。" 在3D目标检测领域,处理无结构和稀疏的3D几何数据,如点云,是一项关键任务。目前有两种主流方法:一种是直接操作点云,利用如PointNet++的网络,但这种方法在大规模自动驾驶场景中由于邻居采样和分组操作的计算复杂度较高,不适合实时需求;另一种方法是将点云转化为体素,采用3D稀疏卷积神经网络(SparseCNNs)进行特征提取,其结构与2D CNNs相似,包含多个特征阶段和下采样操作。 虽然常规稀疏卷积和子流形稀疏卷积在处理3D数据中得到广泛应用,但它们各自存在局限性。常规稀疏卷积会增加计算负担,通常只在下采样层中使用,而子流形稀疏卷积可能无法充分区分目标对象和背景特征。为了解决这些问题,作者提出了焦点稀疏卷积(Focals Conv)和Focals Conv-F,这两个新模块预测位置重要性,动态调整特征稀疏性,能够更好地适应非均匀的3D数据,并且可以直接替换现有稀疏CNNs中的普通模块,进行端到端的联合训练。 论文的实验部分展示了在多个基准测试上的优秀性能,尤其是在nuScenes上,提出的Focals Conv方法打破了单模型的记录。这表明,可学习的空间稀疏性在复杂3D目标检测任务中具有重大价值。研究代码和模型已公开,可供进一步研究和应用。 这篇论文为3D目标检测提供了一种新的有效策略,通过引入学习性位置重要性,改进了稀疏卷积网络的效率和性能,对实时3D感知系统,特别是自动驾驶领域,有着重要的理论和实践意义。

相关推荐