基于超级像素的高效立体匹配深度图像生成

0 下载量 95 浏览量 更新于2024-09-05 收藏 5.91MB PDF 举报
本文主要探讨了"充分利用超级像素进行快速立体声匹配"的研究,发表在《计算机与通信》杂志2018年第6卷,15-27页。作者Masayuki Miyama来自日本金泽大学电气工程与计算机科学系,针对深度图像生成问题,提出了一个创新的解决方案。 核心思想是通过将立体匹配操作集中在超级像素(SP)上进行优化。传统的立体匹配通常在每个像素点进行匹配,而在该方法中,仅在SP的中心执行块匹配。这样做减少了计算量,同时保留了局部图像结构信息。匹配到的视差值被扩展应用到SP内的所有像素,使得处理更高效。 进一步的改进在于引入了一种基于SP的成本过滤器。这个滤波器考虑了可靠性(如纹理一致性和边缘信息)和相似性(像素间的距离)等因素,通过将周围SP的匹配成本根据这些权重进行调整,然后计算加权后的总成本。这种方法有助于降低噪声和提高匹配的准确性。 此外,为了确保匹配质量,文章提出了两种创新的错误检查策略。一是单向检查(One-way check),它利用单向视差估计,通过减少计算量来快速检测可能的错误。这种方法执行时间仅为全搜索的1/100,但准确性保持在高水平。 另一项技术是交叉恢复(Cross recovery),它结合了交叉检查和错误恢复机制,用于修复由SP匹配可能导致的物体缺失或错误。这种方法在保持高精度的同时,提高了执行效率,执行时间大约是全搜索的1/60。 这项研究通过有效利用超级像素并结合新颖的成本过滤器和错误检查方法,显著提升了立体声匹配的速度和精度,对于深度图像生成以及实时三维重建等领域具有重要的实践价值。其研究成果对于减少计算负担,提高系统性能,扩大深度图像在诸如机器人导航、增强现实等领域的应用有着积极的推动作用。