多视图深度图估计:像素级关联适应性选择

需积分: 14 0 下载量 22 浏览量 更新于2024-09-07 收藏 17.07MB PDF 举报
"这篇论文提出了一种多视角深度图估计方法,旨在自适应地确定参考图像与源图像集所有元素之间的像素级数据关联。通过在概率框架内解决像素级视图选择和深度图估计问题,利用局部两两图像一致性进行建模。相应的图形模型通过基于EM的视图选择概率推理和类似PatchMatch的深度采样和传播算法来求解。实验结果表明,这种方法在标准多视角基准测试中提供了最先进的估计精度,通过减少错误的像素级数据关联。此外,大量互联网众包数据的实验验证了我们方法对无结构和异构图像捕获特性的鲁棒性。此外,我们的方法线性的计算和存储需求以及固有的并行性,使得能够实现高效且可扩展的GPU基础实现。" 详细说明: 这篇论文的核心是提出了一种新的多视角深度图估计技术,该技术着重于如何选择最合适的源图像子集来估计参考图像中特定像素的深度。这解决了在多视角场景中,如何有效利用不同视角的信息以提高深度估计的准确性的问题。 首先,作者将问题置于一个概率框架下,通过考虑局部的两两图像一致性(photoconsistency)来同时建模像素级视图选择和深度图估计。这种框架允许模型在估计深度的同时,选择出对目标像素深度估计最有贡献的源图像视图。 然后,他们引入了一种基于期望最大化(EM)的视图选择概率推理方法,这有助于确定哪些源图像对于某个像素的深度估计最有价值。同时,他们借鉴了PatchMatch算法的思想,进行深度采样和传播,这使得深度估计过程更加高效。 实验部分展示了该方法在标准多视角基准测试中的优秀性能,证明了避免错误像素级数据关联可以显著提高深度估计的准确性。此外,通过在大规模的互联网众包数据上进行测试,证明了该方法在面对不规则、多样化的图像捕获条件时仍能保持稳健性。 最后,由于算法的线性计算和存储需求以及并行性,它能够适应GPU平台,从而实现高效和可扩展的实现,这对于处理大数据量的多视角深度图估计任务至关重要。 这篇论文提供了一种创新的多视角深度图估计方法,通过优化像素级的数据关联和利用概率模型,提高了深度估计的精度和鲁棒性,同时考虑了实际应用中的计算效率。