深度学习驱动的多视图三维重建：提升现实场景细节再现

77 浏览量更新于2024-06-20 收藏 1.55MB PDF 举报

本文主要探讨了多视图学习光一致性在三维形状重建中的应用，特别是在现实生活中复杂性能捕获场景中的作用。随着虚拟现实和增强现实技术的兴起，对高质量3D内容的需求日益增长，尤其是那些源自真实环境的内容。三维形状重建是这一领域的重要组成部分，它涉及从多视角RGB图像中恢复物体的精确3D模型。传统的多视图重建流程依赖于寻找图像间的匹配特征来推断深度信息，这是一个关键步骤。本文提出了一种创新方法，即利用深度学习特别是卷积神经网络（CNN）来学习多视图光一致性。这一概念的基础是，深度网络有能力理解并处理不同观察角度下物体表面的光照变化，即使这些光线可能来自不同的方向。研究者通过实验证明，经过标准静态数据集训练的CNN能够在恢复动态场景的表面细节上超越传统基于2D特征的方法，特别是在存在噪声、低对比度和纹理稀疏区域时，如人体的某些部位（如手臂、腿和裙褶）。作者们关注的焦点是提升重建的保真度和质量，尤其是在性能捕获设置中，这是当前技术仍需改进的地方。他们通过实验展示了使用CNN的多视图立体重建方法在现实场景中的优势，与现有最先进的重建管道相比，不仅在标准评估数据集上取得了更好的结果，而且在与现实性能捕获数据的比较中也展现出更强的泛化能力。本文的主要贡献在于引入了一种基于深度学习的策略，它不仅提高了重建的精度和鲁棒性，而且特别适用于捕捉复杂场景中难以被传统方法准确恢复的细节。通过使用CNN进行多视图光一致性测量，研究者们为三维形状重建领域提供了一个新的视角，这对于虚拟现实和增强现实的发展具有重要意义。关键词：多视图立体重建、学习光致密度、性能捕获、体积扫描。这一工作对于推动3D重建技术在实际应用中的进步具有积极的推动作用，未来的研究可能将进一步探索如何优化这种学习策略，使其在更多场景和条件中发挥出更大的潜力。

诉Leroy，J.S.Franco和E.博耶

比视图不可知方法对遮挡更鲁棒，这是在实践中经常发生的多个移动

形状或通过肢体自遮挡的问题。

虽然经典的MVS方法已经普遍成功，最近的工作，旨在学习立体

光一致性强调，额外的先验和更微妙的变化的相互依赖性仍然是在现

实世界的数据中发现。一些作品通过学习如何匹配短基线立体声的

2D补丁对来利用这一点，让深度网络推断哪些特征是相关的[40，

24，41，39]。最近的工作将该原理扩展到宽基线MVS，具有2D学习

特征的对称组合[14]。

具有2D感受野的这种方法的共同限制是难以正确地捕获3D相关

性，因此具有由2D投影引起的假阳性和假阴性相关性因此，许多学

习的MVS方法转而求助于全体积3D感受野虽然也在3D中铸造相关

性，但我们的方法提出了几个关键区别：我们的体积感受野是反向投

影的图像区域，类似于一些双目立体[19]或基于图像的绘制[11]的工

作，其中后者仅使用网格作为代理，而不明确地提取3D信息。这使

得能够实现沿着观看光线的扫描搜索策略，这证明了作为立体重建中

的平面扫描的鲁棒搜索策略。该方案还避免

了

将相机分辨率和3D感

受野分辨率解相关，如例如体素，体积感受野被定义为沿着像素射线

的反投影。此外，该体积感受野学习局部成对相关性，这是比学习占

用网格模式更低水平和更容易的任务我们对实际性能捕获场景的评

估，超越了传统的静态数据集，验证了这种学习策略优于传统方法的

好处。

方法概述

对于许多最近的多视图立体重建方法，我们估计每个相机的深度图，

然后进行深度融合，因此允许每个相机利用局部估计提供所观察表面

上的局部细节。我们采取这种策略更进一步，取代传统的

photoconsistency措施，用于估计深度与学习的版本。该版本基于

CNN，并利用其学习从多个视点观察到的表面附近的局部光度配置的

能力。如图2所示，我们的方法将一组校准图像作为输入，并输出通

过融合深度图获得的3D网格。使用体积扫描策略来获得沿着像素观

看射线的深度，该体积扫描策略沿着射线对多视图光致一致性进行采

样并识别最大值。对于沿着视线的点，使用该点周围的离散化3D体

积块来估计光致一致性。在这样的3D补片中，在该补片内的每个点

处，来自入射到该点的主相机光线的颜色信息与另一相机的入射光线

的颜色信息配对。我们为每一个其他的摄像机收集这些成对的颜色体

积

剩余15页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

深度学习驱动的多视图三维重建：提升现实场景细节再现

二维视图特征在三维重建中的应用

多视图立体视觉三维重建：深度信息融合与优化方法

视觉三维重建技术：发展历程与关键方法

基于二维视图特征的三维重建

医学三维重建之CT三维重建

点云三维重建

yuan基于双目视觉的三维重建(matlab),双目立体视觉三维重建,matlab源码.zip

车辆三维重建MATLAB源码，对模型训练后可以对车辆图片进行三维重建。2.zip

三维重建算法 MATLAB 点云数据

基于Python的三维重建开源代码

最新资源