申抒含:大规模场景三维重建的SLAM与SfM方法

需积分: 39 33 下载量 165 浏览量 更新于2024-07-17 1 收藏 27.5MB PDF 举报
申抒含的报告聚焦于"基于图像的大规模场景三维重建"这一主题,主要探讨了三维几何视觉在SLAM(Simultaneous Localization and Mapping,同时定位与地图构建)领域的核心问题。SLAM是智能机器人,如无人车和增强现实(AR)系统中不可或缺的技术,它涉及到对环境的三维理解,包括场景的结构和相机的六自由度空间位姿。 报告首先强调了三维环境感知的重要性,因为这直接影响到机器人的感知、决策和行动能力。在大规模场景中,SLAM技术被分为两种主要途径:一种是在线SLAM,如通过视频序列进行实时处理,包括局部匹配、PnP(Perspective-n-Point)方法与三角化、局部束调整、闭环检测和图优化等步骤。这些技术允许机器人实时构建稀疏、准稠密或稠密的场景结构,并保持相机的精确位置。 另一种途径是结构从运动(Structure from Motion,SfM),通常用于离线处理多视角图像,通过全匹配、种子选择、两视图重建等步骤,先重建场景的稀疏结构,然后利用PnP计算相机的实时姿态。SfM通常涉及增量式处理,例如Nextbestview策略和ViewGraph简化,以优化整体模型。 图像三维重建的基本流程包括从稀疏点云开始,经过重建(可能生成稠密点云)、点云分割、语义分割(区分出不同部分和物体的语义信息),进而进行部件级别的语义建模,以及将单体模型转化为更复杂的三维语义模型。这些步骤不仅关注几何精度,还着重于提高模型的可用性和理解性。 申抒含的研究报告针对CSIG第一届全国SLAM技术论坛在浙江大学举办的活动,展示了SLAM技术在数字城市和无人驾驶等领域的实际应用,以及如何通过不断优化和创新来解决三维几何视觉中的挑战。这份报告深入探讨了技术细节,为相关研究者提供了宝贵的学习资源和最新进展。