Diverse3DFace：从单幅遮挡人脸图像生成多样化三维重建

55 浏览量更新于2024-06-20 收藏 2.4MB PDF 举报

"这篇论文提出了一种名为Diverse3DFace的方法，专门针对单幅遮挡人脸图像生成多样且高质量的三维重建。该方法由整体+局部形状拟合、基于图形神经网络的网格VAE和多样性促进迭代优化三部分组成。Diverse3DFace能够从遮挡的面部图像中估计出与可见区域一致且在遮挡区域表现出高多样性的3D形状。与现有方法相比，其在遮挡区域的多样性提高了50%，并且在接近真实情况的样本上的均方误差(MSE)降低了40%。代码和数据可在提供的链接中获取。" 在单张遮挡人脸图像的三维重建领域，Diverse3DFace是一个突破性的技术，它解决了传统方法无法处理遮挡和生成多样性重建的问题。首先，遮挡导致的错误3D重建是由于模型在处理时可能会错误地利用或忽视遮挡部分的信息。Diverse3DFace通过选择性地使用可见区域的特征，避免了这种问题，确保了3D形状的准确性。其次，Diverse3DFace的独特之处在于它能生成多样化的重建结果。在被遮挡的区域，可能存在多种合理的3D形态，这些形态与图像可见部分相匹配，但遮挡部分有差异。通过一个图形神经网络基础的网格VAE和多样性促进的迭代优化过程，Diverse3DFace能够捕捉这种多样性，生成多个可能的、真实的3D人脸模型。在实验部分，Diverse3DFace在面具、眼镜等遮挡物下的表现优于其他基线方法，不仅在可见区域保持一致性，而且在遮挡区域展现出了更高的多样性。这意味着对于同样的遮挡人脸图像，Diverse3DFace能够提供更广泛、更真实的解决方案集合，这对于人脸识别、动画或者虚拟现实应用有着重要的意义。此外，论文还指出，Diverse3DFace的性能通过与最近的先进技术进行定量和定性比较得到了验证，其在最接近地面真相的样本上的MSE比其他方法降低了40%，显示了该方法在准确性和多样性之间的良好平衡。 Diverse3DFace为解决遮挡人脸图像的三维重建问题提供了新的视角和有效工具，对于推动3D人脸重建技术的发展具有重大价值。研究人员和从业者可以通过提供的开源代码和数据进一步研究和应用这一方法。

1549

∈

S ∈ E ∈

S S E

−

∈

⊆ Y

Bahat

等人

[1]通过仅在低分辨率空间中强制一致性来

与关注纹理多样性的基于图像的方法相比，3D重建需

要建模几何多样性。作为该领域最具开创性的著作之

一， Kulesza 和 Taskar [20] 引入了确定性点过程

（DPP）的框架，以建模机器学习任务中的多样性，

如推理，采样，边缘化

等

。 Yuan

等人

[49，50]采用

DPP对多模态潜在向量进行采样，以进行各种人类轨

迹预测。Elfeki

等人。

[10]设计了一个基于DPP的目标

来训练GAN和VAE，以模拟真实数据的多样性。在这

项工作中，我们采用DPPs的思想，通过发现潜在的空

间表示，最大限度地提高可信的多样性，同时保持忠

实于可见部分的遮挡区域，以

背景

3D人脸重建的统计模型：统计3D模型，如BFM [3，

26]和FLAME [21]允许生成新的人脸实例。这些模型通

常包括解释身份之间的几何变化的

形状模型

、解释由

于不同面部表情而引起的变化

的表情模型

，以及另外

分别解释姿势和外观变化的

姿势模型

和

外观模型

具体

来说，火焰

[21]将3D形状定义为：

S（β

，

θ）

W（T（β

，

θ）

，

J（β）

，

W）

，

（1）

其中，参数 β

、

、分别

表示形状、姿态和表情参

数;JR

3 K

表示K

个

面部关节的位置，T（β

、

）围绕

该位置旋转，并最终通过混合权重进行平滑。未对准

形状T（β

，

θ）通过将形状、表情和姿态变化的贡

献加在

模板形状

′

的顶部

来获得

：

（

，

）

（

;

）

（

;

）

（

;

）

（

）

形状和表情变化由线性

混合形状

（β

;

）

β和

（β

;

）

β来模拟，其中

N ×| β|

N×|

ψ|

分别

是使用

PCA

学习的

正交形状和表达式基础

，

是

顶点数。位姿融合变形

函数定义

为

（θ

）

（R

（θ）R（θ）），其中R（θ）由围绕K个关节的

旋转矩阵组成，

R3N

×9K

是描述由

激活的顶点相对

于静止位姿的偏移的位姿融合

变形

。

决定点过程：决定点过程（DPPs）起源于量子物理

学，用于模拟费米子量子态之间的负相关[23]。DPP最

早由Kulesza和Taskar [20]在机器学习中引入，作为一

种概率模型，

点与点之间的排斥一个基集上的点过程描述了它的所

有

个

子集的概率。当选择随机子集Y 的概率由Y的

元素所索引的子核矩阵

的行列式给出时，点过程是

行列式

的，即

，P（Y ）

det（

）。给定一

个数据矩阵B

D×N

，我们可以将核计算为Gram矩

阵

B。在这种情况下，子核矩阵det（

）的行

列式与B的元素所张成的体积有关。因此，从概念上

讲，DPP将更高的概率分配给其元素趋于正交（di-）

的子集。

彼此之间，有着更大的距离。

方法

如我们在实验中所示，由于多种原因，仅使用全局

模型在单个阶段中重建不同的3D形状是次优的（第2

节）。5.1）。首先，将全局模型拟合到几个可见的子

区域需要在鲁棒性和局部保真度之间进行仔细的权衡

其次，遮挡区域的多样化将无意中影响可见区域的拟

合质量，反之亦然。鉴于这些观察，我们提出了一个

三步的方法来生成不同的，但现实的3D重建从一个闭

塞的人脸图像。在第1步中，我们使用解纠缠的全局+

局部形状模型的集合来执行鲁棒的3D重建，对面部的

可见部分进行重建。在步骤2中，我们采用VAE将部分

拟合映射到潜在空间，从中可以绘制多个重建最后，

在步骤3中，我们迭代地优化潜在嵌入，以促进被遮挡

面部区域上的真实几何多样性，同时保持对可见区域

的保真度。我们现在描述我们的完整算法及其不同组

件。

4.1.

全局

局部形状模型

准确拟合面部可见部分的鲁棒局部3D重建现有的遮

挡鲁棒3D重建方法通常采用全局模型来基于可见区域

进行拟合或回归[8，42]。由于此类模型的

全局

性质，

遮挡分割中的错误会影响3D重建的质量[30]，即使是

可见部分（见图5）。通常，采用强正则化来减轻这种

影响。然而，虽然较重的正则化导致对遮挡的更强鲁

棒性，但它以次优拟合为代价这一观察结果，以及局

部变形组件在计算机图形学中的成功应用[25，32]，

促使我们采用全局+局部模型的集成作为有效的方法来

生成鲁棒的3D重建w.r.t可见部分。请注意，在我们的

解决方案的这个阶段，我们不关心所包含区域中的重

建质量我们现在描述我们提出的

剩余14页未读，继续阅读

cpongm

粉丝: 6

Diverse3DFace：从单幅遮挡人脸图像生成多样化三维重建

深度学习在基于单幅图像的物体三维重建中的应用.pdf

基于卷积神经网络的单幅图像三维人脸重建.pdf

基于单幅图像的三维重建技术综述

Diverse3DFace方法在处理单幅遮挡人脸图像时，是如何结合图形神经网络和VAE技术来提升遮挡区域重建多样性的？

在遮挡人脸图像的三维重建中，Diverse3DFace如何处理遮挡区域的信息并提高重建多样性的？

Diverse3DFace方法在遮挡人脸图像三维重建过程中，是如何通过图形神经网络和VAE技术提升遮挡区域多样性的？

单幅图像三维重建对图像的要求

融合PointNet 和3D-LMNet 的单幅图像三维重建及语义分割具体步骤

融合PointNet 和3D-LMNet 的单幅图像 三维重建及语义分割

融合PointNet 和3D-LMNet 的单幅图像三维重建及语义分割

最新资源

融合PointNet 和3D-LMNet 的单幅图像三维重建及语义分割