深度学习驱动的视觉SLAM技术探析

需积分: 48 8 浏览量更新于2024-09-09 1 收藏 665KB PDF 举报

"这篇文章是关于基于深度学习的视觉SLAM的研究综述，主要探讨了深度学习如何应用于SLAM领域，包括帧间估计、闭环检测和语义SLAM的关键进展，并对比了传统SLAM与深度学习SLAM的差异，对未来的研究方向进行了展望。" 基于深度学习的视觉SLAM是一种融合了计算机视觉和深度学习技术的同步定位与地图创建方法。随着深度学习技术的发展，它在解决SLAM问题上的潜力逐渐被挖掘出来。SLAM是机器人自主导航和移动的重要组成部分，目标是使机器人在未知环境中能够同时构建地图并确定自身位置。深度学习在此领域的应用主要体现在以下几个方面： 1. 帧间估计：传统的SLAM系统通常依赖于特征匹配来估计相机的运动，而深度学习可以更有效地处理图像的复杂性和变化。通过训练神经网络模型，如深度卷积网络，可以从连续的图像序列中直接估计相机的运动参数，提高了帧间运动估计的准确性和鲁棒性。 2. 闭环检测：SLAM中的闭环检测至关重要，因为它能纠正由于长期漂移导致的定位误差。深度学习可以学习到具有时空一致性的表示，用于识别和验证已访问过的位置，提高闭环检测的效率和准确性。 3. 语义SLAM：深度学习在图像理解和语义分割方面的优势使得SLAM系统能够构建包含环境对象和特征的语义地图。这种语义信息可以增强地图的描述能力，有助于机器人理解环境，提升决策和规划的智能性。与传统SLAM算法相比，基于深度学习的SLAM有以下优势和挑战：优势： - 精度：深度学习模型可以从大量数据中学习，从而提供更精确的特征提取和运动估计。 - 自适应性：深度学习模型能适应各种环境和光照条件，提高在复杂场景下的性能。 - 实时性：尽管计算需求较高，但随着硬件加速和模型优化，深度学习SLAM的实时性正在逐步改善。挑战： - 数据需求：深度学习通常需要大量的标注数据进行训练，这对于SLAM的实时应用来说是个挑战。 - 泛化能力：模型可能在未见过的环境下表现不佳，需要更广泛的训练数据和更强的泛化能力。 - 可解释性：深度学习模型的黑盒特性可能导致结果难以解释，这对系统的可靠性和安全性构成挑战。未来的研究方向可能包括： 1. 更高效的模型：开发轻量级模型以满足实时性需求，同时保持高精度。 2. 数据驱动的自适应SLAM：利用在线学习或迁移学习，让系统能根据环境变化自我调整。 3. 结合多模态信息：融合激光雷达、惯性测量单元（IMU）等其他传感器信息，提升SLAM的稳定性和鲁棒性。 4. 鲁棒性与安全性：强化深度学习SLAM在异常情况下的鲁棒性，确保系统在错误发生时能及时恢复或采取安全措施。深度学习为视觉SLAM带来了革新，尽管面临挑战，但其潜力和前景十分广阔，有望推动SLAM技术在自动驾驶、无人机导航、服务机器人等领域取得更大的突破。

第 39 卷第 6 期

2017 年 11 月

机器人 ROBOT

Vol.39, No.6

Nov., 2017

DOI：10.13973/j.cnki.robot.2017.0889

基于深度学习的视觉 SLAM 综述

赵洋，刘国良，田国会，罗勇，王梓任，张威，李军伟

（山东大学控制科学与工程学院，山东济南 250061）

摘要：综述了深度学习技术应用到同步定位与地图创建（SLAM）领域的最新研究进展，重点介绍和总结

了深度学习与帧间估计、闭环检测和语义 SLAM 结合的突出研究成果，并对传统 SLAM 算法与基于深度学习的

SLAM 算法做了深入的对比研究．最后，展望了未来基于深度学习的 SLAM 研究发展方向．

关键词：深度学习；视觉 SLAM；帧间估计；视觉里程计；闭环检测；语义 SLAM

中图分类号：TP24 文献标识码：A 文章编号：1002-0446(2017)-06-0889-08

A Survey of Visual SLAM Based on Deep Learning

ZHAO Yang，LIU Guoliang，TIAN Guohui，LUO Yong，WANG Ziren，ZHANG Wei，LI Junwei

(School of Control Science and Engineering, Shandong University, Ji’nan 250061, China)

Abstract: Latest research progresses of deep learning techniques applied to SLAM (simultaneous localization and map-

ping) are summarized. In addition, the prominent achievements on inter-frame motion estimation, loop closure detection and

semantic SLAM incorporated with deep learning are introduced. Furthermore, the deep learning based SLAM is compared

with the traditional ones in detail. Finally, the future research directions of advanced SLAM based on deep learning are

discussed.

Keywords: deep learning; visual SLAM (simultaneous localization and mapping); inter-frame motion estimation; visual

odometry; loop closure detection; semantic SLAM

1 引言（Introduction）

同时定位与地图构建（SLAM）是机器人搭载

视觉、激光、里程计等传感器，对未知环境构建地

图的同时实现自定位的过程，在机器人自主导航任

务中起着关键作用

[1-4]

．当前 SLAM 问题的研究手

段主要是通过在机器人本体上安装多类型传感器来

估计机器人本体运动信息和未知环境的特征信息，

利用信息融合实现对机器人位姿的精确估计以及

场景的空间建模．尽管 SLAM 采用的传感器有激

光和视觉等多种类型，但其处理过程一般包含 2 个

部分

[5]

（如图 1 所示）：前端帧间估计和后端优化．

前端帧间估计解决的是机器人在获取前后 2 帧传

感器信息的时间间隔内的运动估计，而后端优化解

决的是机器人检测到路径闭环后对历史轨迹的优化

问题

[6]

．考虑到里程计等传感器信息积累的误差，

后端优化就变得尤为重要，其关键是正确的检测闭

环．相对于激光传感器单一的空间结构感知信息，

视觉传感器凭借其丰富的色彩和纹理等感知信息在

提高帧间估计精度和闭环检测正确率方面有着巨大

的优势和潜力

[7,8]

．

视觉 SLAM（visual SLAM）是以图像作为主

要环境感知信息源的 SLAM 系统，可应用于无人

驾驶、增强现实等应用领域，是近年来的热门研

究方向

[9-12]

．典型视觉 SLAM 算法以估计摄像机

位姿为主要目标，通过多视几何理论来重构 3D 地

图．为提高数据处理速度，部分视觉 SLAM 算法

首先提取稀疏的图像特征，通过特征点之间的匹

配实现帧间估计和闭环检测，如基于 SIFT （scale-

invariant feature transform）特征的视觉 SLAM

[13]

和

基于 ORB（oriented FAST and rotated BRIEF）特征

的视觉 SLAM

[14]

．SIFT 和 ORB 特征凭借其较好的

鲁棒性和较优的区分能力以及快速的处理速度，在

视觉 SLAM 领域受到广泛应用．但是，人工设计的

稀疏图像特征当前有很多局限性，一方面如何设计

基金项目：国家自然科学基金（61603213）；中国博士后科学基金（2016M590635）；山东省优秀中青年科学家科研奖励基金（BS2014DX010）；山

东大学人才引进与培养类专项基金（2015TB009）；山东省泰山学者工程．

通信作者：刘国良，liuguoliang@sdu.edu.cn 收稿／录用／修回：2017-02-15/2017-05-12/2017-06-15

889

下载后可阅读完整内容，剩余7页未读，立即下载

zhangyin497

粉丝: 0

深度学习驱动的视觉SLAM技术探析

视觉slam综述论文总结很到位

基于深度学习的视觉SLAM 综述

深度学习在视觉SLAM研究中的应用综述

基于深度学习的SLAM综述.pdf

深度学习在视觉SLAM中应用综述.pdf

计算机视觉与深度学习SLAM综述（自主移动机器人同时定位与地图创建） 计算机视觉.pdf

深度学习与视觉SLAM技术研究论文综述

深度学习驱动的视觉SLAM：进展、融合与前景

SLAM技术综述：激光雷达与视觉SLAM融合分析

基于深度学习的图像感知SLAM调研

最新资源

计算机视觉与深度学习SLAM综述（自主移动机器人同时定位与地图创建）计算机视觉.pdf