D3VO:深度学习驱动的单目视觉里程计

0 下载量 105 浏览量 更新于2024-06-20 收藏 1.61MB PDF 举报
"本文介绍了一种名为D3VO的新框架,该框架专注于单眼视觉里程计,结合深度、深度姿态和深度不确定性估计。D3VO使用深度网络进行自监督单目深度估计训练,并且能够在没有外部监督的情况下处理立体视频。通过对输入图像的光度不确定性建模,提升了深度估计的准确性,为直接视觉里程计提供了学习的权重函数。实验结果显示,D3VO网络在自监督深度估计任务上优于现有技术。在集成到直接视觉里程计中时,D3VO的前端跟踪和后端非线性优化均得到增强,表现出与最先进的单眼、立体和LiDAR里程计相当的性能。" D3VO的主要贡献包括: 1. **自监督深度估计**:D3VO提出了一种新的方法,使用深度网络对立体视频进行自监督训练,无需额外的外部监督。通过调整图像对的光照条件,使它们匹配预测的亮度变换参数,从而训练网络进行单目深度估计。 2. **光度不确定性建模**:D3VO考虑了输入图像像素的光度不确定性,这种建模有助于提高深度估计的精度。它为直接视觉里程计的光度残差提供了学习权重函数,增强了系统的鲁棒性。 3. **深度、深度姿态和深度不确定性的紧密集成**:D3VO将预测的深度、姿态和不确定性整合到直接视觉里程计的前端跟踪和后端非线性优化中。这一集成解决了单目视觉里程计常见的尺度漂移问题,提高了系统性能。 4. **性能比较**:D3VO在KITTI里程计基准和EuRoCMAV数据集上的评估显示,其性能显著优于传统的单眼视觉里程计方法。同时,D3VO的表现与最先进的立体/LiDAR里程计和视觉惯性里程计相当,但只使用单一摄像头。 5. **应用领域**:深度学习的应用拓宽了计算机视觉的范围,但在SLAM和VO领域,基于几何的传统方法仍然占据主导地位。D3VO通过深度网络的引入,为单目视觉里程计带来了新的可能性,特别是在硬件成本和校准需求较低的情况下。 6. **挑战与未来工作**:尽管D3VO取得了显著的进步,但单目深度估计仍存在尺度漂移和鲁棒性问题。未来的研究可能需要继续探索如何进一步改进深度网络,以实现更准确、更稳定的单目视觉里程计系统,特别是在动态环境和复杂光照条件下。