高效大场景立体匹配算法：加速百万像素图像深度估计

需积分: 0 195 浏览量更新于2024-08-05 收藏 5.51MB PDF 举报

"这篇文章主要介绍了一种高效的大规模立体匹配方法，旨在快速处理高分辨率图像的匹配问题。该方法通过建立视差的先验，在支持点上进行三角测量，减少了匹配模糊度，实现了精确的密集重建。同时，该方法能自动确定视差范围并易于并行化，适用于自动驾驶等实际应用。在Middlebury基准测试中，该方法显示了高级别的性能，且能在单个CPU核心上快速处理百万像素图像对的左右视差图。" 在计算机视觉领域，立体匹配是估算两幅图像间对应像素深度的关键技术，这对于三维重建、自动驾驶等应用至关重要。传统的立体匹配方法通常分为基于局部对应和全局对应两大类。基于局部对应的方法（如SIFT、SURF）速度快，但受限于窗口大小的选择，可能造成匹配率低或边界溢出的问题，尤其是在处理纹理稀疏或模糊的区域时。而基于全局对应的方法，如采用马尔可夫随机场（MRF）模型的算法，通过平滑约束来提高匹配质量，可以解决局部方法的一些不足。然而，这些方法通常需要解决NP-hard问题，计算复杂度高，对于高分辨率图像来说，执行速度慢且内存需求大。文章提出的高效大场景立体匹配方法创新地结合了两者的优势。它在一组稳健的匹配支持点上构建三角测量，减少了匹配不确定性，这有助于有效地利用视差搜索空间，而无需全局优化。此外，这种方法能够自动确定合适的视差范围，简化了参数调整，并且可以方便地进行并行计算，极大地提高了处理速度。在Middlebury基准测试中，该方法表现出了优秀的性能，显著提高了处理速度，例如，能够在单个CPU核心上在一秒钟内完成一对百万像素图像的视差图计算。这样的效率对于实时应用如自动驾驶系统来说至关重要，因为它允许快速准确地获取深度信息，进而做出及时的决策。这项工作为大规模立体匹配提供了一个新的解决方案，不仅提高了匹配精度，还降低了计算资源的需求，对实时和大规模的3D视觉任务具有重要的实用价值。

Eﬃcient Large-Scale Stereo Matching 3

优化通常使用赢者通吃策略来执行，该策略为每个像素选择具有某个度量的最

小值的视差[2]。韦伯等人[3]使用Census变换和GPU实现实现了实时性能。然

而，如图1所示，传统的局部方法[11]通常面对边界流血效应或模糊性的矛盾。

基于自适应支持窗口[12,13]的方法调整窗口大小或在固定大小的窗口内调整像

素权重以改善性能，尤其是接近边界不连续的位置。不幸的是，因为对于每个

像素，必须计算许多权重因子，这些方法比固定窗口方法慢得多[13]。

通过全局方法可以获得密集和精确的匹配，通过最小化基于MRF的能量函数

来明确地增加平滑度，该能量函数可以被分解为数据计算项和正则化项的总

和。由于对于大多数实际使用的能量，这种优化是NP难的，所以已经提出了近

似算法，例如，图形切割[4,5]，信念传播[6]。克劳斯等人。[14]扩展了全局

方法，使用均值漂移颜色分割，然后在超像素上进行信任传播。在[15]中，提

出了一种用于信任传播的并行VLSI硬件设计，该设计在VGA图像上实现了实时性

能。然而，全局方法在高分辨率图像中的应用受到其高计算和存储要求的限

制，特别是在存在大的视差范围时。此外，基于像素之间的二进制电位的模型

有利于前平行表面，这导致低纹理倾斜表面中的误差。高阶集团可以克服这些

问题[7]，但它们的计算要求更高。

Hirschm¨uller提出了半全局匹配[16]，这种方法扩展了多项式时间一维扫描

线方法，以便沿着16个方向传播信息。与基于动态规划的传统方法相比，在减

少条纹伪像和提高精度的同时，计算复杂度随着计算路径的数量而增加。在

[17]中使用'ground control points'来提高动态规划算法的(occlusion cost)

遮挡代价的灵敏度。在[18,19]中，视差是从一小组初始相关种子中“增长”出

来的。虽然这些方法可以产生准确的结果，并且可以比全局方法更快，但它们

不能提供密集的匹配,对于无纹理和扭曲的图像区域效果也不好。已经研究了减

少搜索空间的方法用于全局方法[10,20]。但是，它们主要关注内存需求，以一

个局部算法为开端进行一个全局的搜索。此外，使用图形切割会产生高计算成

本，特别是对于大规模图像。

相比之下，在本文中，我们提出了一种贝叶斯方法来进行立体匹配，能够以

接近实时的帧速率计算高分辨率图像的精确视差图，而无需进行全局优化。本

文的其余部分结构如下：在第3节中，我们描述了我们的高效立体匹配方法。

第4节报告了真实世界数据集的实验结果以及与Middlebury基准图像上的各种其

他方法的比较。最后，第5节给出了我们的结论和未来的工作。

剩余13页未读，继续阅读

查理捡钢镚

粉丝: 22
资源: 317

高效大场景立体匹配算法：加速百万像素图像深度估计

Efficient Large Scale Stereo代码

ELAS开源程序（高效大规模立体匹配）

effective large scale stereo matching

elas立体匹配的基本原理

双目立体匹配算法有哪几种

openCV官方有哪些立体匹配算法

如果我是对远距离目标进行立体匹配那种算法速度快，效果好？

现有的效果比较好的双目视觉立体匹配算法有哪些

matlab单目相机深度图

v-if v-elas

最新资源