立体视觉深度获取:基于区域相关性的稠密立体匹配

需积分: 45 5 下载量 102 浏览量 更新于2024-07-10 收藏 10MB PPT 举报
"基于区域相关性的立体匹配(稠密)-立体视觉深度获取" 立体视觉是一种利用两台相机从不同视角捕获同一场景的图像,通过分析这些图像中的对应点来估算场景的三维深度信息的技术。这种技术的核心在于立体匹配,即寻找图像对中对应点的匹配关系。在描述中提到的“基于区域相关性的立体匹配(稠密)”方法,是指通过计算图像中一小块区域(窗口)内像素与另一幅图像中潜在对应区域的像素之间的相关性来确定匹配。 首先,我们讨论共轭对的概念。在立体视觉中,如果场景中的一个点在左图像上的投影点是右图像上投影点的对应点,那么这两个点被称为共轭对。视差是这两点在图像平面上的水平距离,它与场景深度有着直接的关系。视差越大,表示对应的场景点离相机越远。 外极平面和外极线是立体视觉中的关键几何元素。当两个相机的光轴平行时,外极线是图像平面上与外极平面相交的直线,所有来自同一场景点的光线都会经过这条线。在实际应用中,由于相机可能会有倾斜或非理想设置,外极线可能不完全重合,导致垂直视差存在。考虑到垂直视差,匹配区域不仅限于外极线上,还包括其邻近的像素点。 立体成像的深度恢复是通过计算视差实现的。然而,随着基线距离增加,虽然可以提高深度估计的精度,但也会减少共同可视范围,并可能导致更大的视差值,增加了匹配的难度和多义性。此外,透视投影会导致图像变形,使得确定共轭对变得更加复杂。 为了解决这些问题,通常会进行立体图像校正,即将图像重新采样,使外极线对应于图像的行,这样可以简化匹配过程。通过刚体变换,可以将两个摄像机的射线投影到一个公共平面上,形成新的图像网格,然后用双变量线性内插法确定每个像素点的新位置。 立体匹配是解决对应问题的关键步骤,它涉及到多种方法,如基于特征的匹配、基于成本的聚合、半全局匹配等。这些方法的目标是找到最佳的对应关系,以最小化匹配误差并处理可能出现的噪声和遮挡。 基于区域相关性的立体匹配方法通过评估图像区域之间的相似性来寻找对应点,从而估计深度信息。这个过程涉及复杂的几何计算、图像校正以及多样的匹配策略,是计算机视觉领域的重要研究方向,广泛应用于自动驾驶、机器人导航、3D重建等多个领域。