Bahat
等人
[1]通过仅在低分辨率空间中强制一致性来
与关注纹理多样性的基于图像的方法相比,3D重建需
要建模几何多样性。作为该领域最具开创性的著作之
一 , Kulesza 和 Taskar [20] 引 入 了 确 定 性 点 过 程
(DPP)的框架,以建模机器学习任务中的多样性,
如推理,采样,边缘化
等
。 Yuan
等人
[49,50]采用
DPP对多模态潜在向量进行采样,以进行各种人类轨
迹预测。Elfeki
等人。
[10]设计了一个基于DPP的目标
来训练GAN和VAE,以模拟真实数据的多样性。在这
项工作中,我们采用DPPs的思想,通过发现潜在的空
间表示,最大限度地提高可信的多样性,同时保持忠
实于可见部分的遮挡区域,以
3.
背景
3D人脸重建的统计模型:统计3D模型,如BFM [3,
26]和FLAME [21]允许生成新的人脸实例。这些模型通
常包括解释身份之间的几何变化的
形状模型
、解释由
于不同面部表情而引起的变化
的表情模型
,以及另外
分别解释姿势和外观变化的
姿势模型
和
外观模型
具体
来说,火焰
[21]将3D形状定义为:
S(β
,
θ
,
θ)
=
W(T(β
,
θ
,
θ)
,
J(β)
,
θ
,
W)
,
(1)
其 中 , 参 数 β
、
θ
、 分 别
表 示 形 状 、 姿 态 和 表 情 参
数;JR
3 K
表示K
个
面部关节的位置,T(β
、
θ
、
)围绕
该位置旋转,并最终通过混合权重进行平滑。未对准
形状T(β
,
θ
,
θ)通过将形状、表情和姿态变化的贡
献加在
模板形状
T
′
的顶部
来获得
:
T
(
β
,
θ
,
θ
)
=
T
<$
+B
S
(
β
;
S
)
+B
P
(
θ
;
P
)
+B
E
(
θ
;
E
)
(
2
)
形状和表情变化由线性
混合形状
BS
(β
;
)
=
β和
BE
(β
;
)
=
β来模拟,其中
R3
N ×| β|
R
3
N×|
ψ|
分别
是使用
PCA
学习的
正交形状和表达式基础
,
N
是
顶点数。 位姿融合变形
函数定义
为
BP
(θ
i
)
=
(R
(θ)R(θ)),其中R(θ)由围绕K个关节的
旋转矩阵组成,
R3N
×9K
是描述由
R
激活的顶点相对
于静止位姿的偏移的位姿融合
变形
。
决定点过程:决定点过程(DPPs)起源于量子物理
学,用于模拟费米子量子态之间的负相关[23]。DPP最
早由Kulesza和Taskar [20]在机器学习中引入,作为一
种概率模型,
点与点之间的排斥一个基集上的点过程描述了它的所
有
2
个
Y
子集的概率。当选择随机子集Y 的概率由Y的
元素所索引的子核矩阵
L
Y
的行列式给出时,点过程是
行列式
的,即
,P(Y )
=
det(
L
Y
)。 给定一
个数据矩阵B
R
D×N
,我们可以将核计算为Gram矩
阵
L
=
B
T
B。在这种情况下,子核矩阵det(
L
Y
)的行
列式与B的元素所张成的体积有关。因此,从概念上
讲,DPP将更高的概率分配给其元素趋于正交(di-)
的子集。
彼此之间,有着更大的距离。
4.
方法
如我们在实验中所示,由于多种原因,仅使用全局
模型在单个阶段中重建不同的3D形状是次优的(第2
节)。5.1)。首先,将全局模型拟合到几个可见的子
区域需要在鲁棒性和局部保真度之间进行仔细的权衡
其次,遮挡区域的多样化将无意中影响可见区域的拟
合质量,反之亦然。鉴于这些观察,我们提出了一个
三步的方法来生成不同的,但现实的3D重建从一个闭
塞的人脸图像。在第1步中,我们使用解纠缠的全局+
局部形状模型的集合来执行鲁棒的3D重建,对面部的
可见部分进行重建。在步骤2中,我们采用VAE将部分
拟合映射到潜在空间,从中可以绘制多个重建最后,
在步骤3中,我们迭代地优化潜在嵌入,以促进被遮挡
面部区域上的真实几何多样性,同时保持对可见区域
的保真度。我们现在描述我们的完整算法及其不同组
件。
4.1.
全局
+
局部形状模型
准确拟合面部可见部分的鲁棒局部3D重建现有的遮
挡鲁棒3D重建方法通常采用全局模型来基于可见区域
进行拟合或回归[8,42]。由于此类模型的
全局
性质,
遮挡分割中的错误会影响3D重建的质量[30],即使是
可见部分(见图5)。通常,采用强正则化来减轻这种
影响。然而,虽然较重的正则化导致对遮挡的更强鲁
棒性,但它以次优拟合为代价这一观察结果,以及局
部变形组件在计算机图形学中的成功应用[25,32],
促使我们采用全局+局部模型的集成作为有效的方法来
生成鲁棒的3D重建w.r.t可见部分。请注意,在我们的
解决方案的这个阶段,我们不关心所包含区域中的重
建质量我们现在描述我们提出的