视觉SLAM技术在机器人定位与地图构建中的研究

需积分: 10 19 下载量 8 浏览量 更新于2024-07-20 1 收藏 12.6MB PDF 举报
"这篇博士学位论文详细探讨了基于视觉的机器人同时定位与地图构建(Simultaneous Localization and Mapping, SLAM)技术,由浙江大学的武二永撰写,专业为通信与信息系统,导师为刘济林和项志宇。论文发表于2007年,旨在通过视觉信息提高SLAM的定位和路标位置估计精度,减少累积误差。 SLAM 是自主机器人领域中的核心问题,它涉及机器人在未知环境中移动时自我定位并构建环境地图的能力。传统的航迹推演方法容易积累误差,而SLAM通过同时估计机器人状态和环境特征来解决这一问题。在随机过程的框架下,SLAM利用概率推演来估计这两种状态。 论文首先介绍了SLAM的贝叶斯滤波理论基础,探讨了如何通过Rao-Blackwellised分解来解耦机器人状态和路标状态,以实现更高效的估计。此外,还讨论了粒子滤波器的基础理论和基本的粒子滤波算法,并提出了一种名为FastSLAM的Rao-Blackwellised粒子滤波算法实现SLAM的具体步骤。 接着,论文关注SIFT(Scale-Invariant Feature Transform)特征点的提取和处理,提出了一种近似的SIFT特征提取方法以及基于kd-tree的快速匹配策略,以优化匹配速度。同时,提出了有效的SIFT特征管理方法,用于地图分割和特征维护。 论文进一步研究了基于双目视觉的SLAM方法,设计了一种算法框架,结合前后两幅立体图像的匹配信息,提出了一种鲁棒的视觉里程计方法。此里程计输出用于初始化FastSLAM2.0算法,逐步完成粒子预测、路标更新和权重计算等关键步骤。 面对单目视觉SLAM中的挑战,如特征点增多和运动不确定性增加,论文提出了一种基于高斯混合模型(GMM)和密度估计的粒子预测提取方法,以提升估计效率和精度。GMM用于环境路标的建模,进一步增强了SLAM的性能。 总体而言,这篇博士论文深入研究了视觉SLAM的各种技术和算法,从理论基础到具体实现,涵盖了从二维到三维,从室内到室外的应用拓展,为实际应用提供了理论和技术支持。"