高分辨率多视点立体视觉与立体匹配的级联代价体优化

需积分: 0 1 下载量 189 浏览量 更新于2024-06-30 1 收藏 19.08MB PDF 举报
"高分辨率多视点立体视觉与立体匹配的级联代价体" 这篇外文科技文献翻译主要关注的是高分辨率多视点立体视觉(MVS)和立体匹配领域中的技术改进。立体视觉和立体匹配是计算机视觉的重要组成部分,它们通过分析不同视角的图像来估计场景的三维结构。在这些任务中,通常会构建3D代价体以帮助正则化和确定深度及视差,但这种方法在处理高分辨率图像时,由于体积的增大,内存和计算时间的需求也会呈立方增长。 文章提出了一种新的级联代价体表示法,旨在提高效率并降低内存和时间成本。这个级联代价体通过编码几何信息和上下文细节,逐步细化特征金字塔来构建。在每个阶段,利用前一阶段的预测来限制深度或视差的搜索范围,从而减少计算量。随着代价体分辨率的提高,深度或视差的间隔也会自适应地调整,以实现更精细的恢复。 将这一方法应用于MVS-Net(一个有代表性的多视点立体视觉网络)后,研究显示在DTU数据集上的性能提升了35.6%,同时减少了50.6%的GPU消耗和59.3%的运行时间。此外,该方法还在Tanks and Temples排行榜上所有深度模型中取得了第一的成绩,证明了其在多个标准上的优越性。 论文还探讨了相关工作,包括现有的MVS和立体匹配算法,并详细介绍了级联代价体的构建、特征金字塔的作用以及损失函数的设计。实验部分展示了在多视点立体视觉和立体匹配任务上的效果,进一步验证了该方法的有效性。 代码已开源在GitHub上,供其他研究者和开发者参考和使用。这表明该工作不仅提供了理论上的贡献,还促进了实际应用的发展。