ReenactGAN：学习驱动的面部再现框架实证研究

181 浏览量更新于2024-06-20 收藏 2.82MB PDF 举报

ReenactGAN: 基于学习的人脸再现框架的研究 ReenactGAN是一种创新的人脸识别框架，专为解决人脸再现问题而设计，旨在从一个特定的视频对象中生成逼真的面部表现。该方法的独特之处在于它突破了传统的像素空间直接转移可能带来的结构伪影问题。在ReenactGAN中，关键步骤包括： 1. 边界潜在空间映射：为了处理像素空间直接转移可能导致的结构不连续性，ReenactGAN首先将源面部特征映射到一个边界潜在空间，这个空间能够更好地保留面部结构信息。通过这种方法，面部的骨骼信息被有效地捕获和整合。 2. 骨级对齐：将面部的骨骼信息从源面部转移到目标面部，这一步确保了在再现过程中保持面部的关键结构一致性，如眼睛、鼻子和嘴巴的位置。 3. 场景编码与生成：结合场景编码技术，ReenactGAN能够根据输入的场景信息动态生成再现目标面部，实现了更自然且与环境融合的效果。 4. 前馈实时性：ReenactGAN的一个显著优点是其纯前馈的结构，这使得整个重演过程可以实现实时运行，例如，在GTX1080 GPU上达到每秒30帧的速率，这对于需要实时交互的应用非常关键。 5. 局限与挑战：尽管基于优化的方法在处理背景方面表现较好，但预定义的参数化3D模型难以捕捉人脸的微小运动。相比之下，ReenactGAN通过学习的方式，简化了算法复杂性，但仍需克服参数拟合的精确度和模型的通用性问题。 ReenactGAN的研究结果展示了在人脸再现领域的重要突破，特别是在处理面部细节和实时性能方面的进步。该框架不仅适用于电影制作和视频会议，还可用于增强现实中的虚拟人物交互，如虚拟主播。作者们承诺将在他们的项目页面上公开数据集和模型，以便其他研究者和开发者进一步探索和应用这一技术。

Wayne Wu

等人

相关工作

Face

Ree

n t

：

大多

数x is t i s t i e t i e

t t

et i e t t i e

t i e ti t i e t i e t i

t i e t i

这三个方面的特点是：

（

1）

功能

，

例如

：跟踪面部模板[41]，

使用光流作为外观和速度测量来匹配数据库中的面部[22]，或者采用

RGB [4]或RGB-D相机[34]来捕获面部运动。面部标志检测方法[51，5]

的最新进展使我们能够有效地跟踪

输入

的面部特征眼睛和动

作

。

（

2）

一旦捕捉到

面部运动，许多研究将随后在参数空间或模型

中拟合运动，包括头部姿势[41，44]、眼睛注视[36，44]或3D模型基

础上的PCA系数[35]，甚至详细的3D面部网格[48]。(3)一旦模型被拟

合，下一步就是重新渲染一个新的视频。加里多等人[8]直接从目标视

频中检索与源视频相似的姿态，并通过变形渲染新视频在[35]中采用

了类似的策略来优化内口生成过程。基于检索的方法可以说是计算效

率低[35，40]。最近，CycleGAN提供了一个新的可行的解决方案，人

脸重现。据我们所知，尽管文献中没有发表的同行评审论文，但在社

区中发布或展示了一些有趣的工作[53，16，47]。与CycleGAN只能处

理单个源人员和一个目标相比生成对抗网络（GAN）和CycleGAN：

生成对抗网络（GAN）[10]已被广泛用于图像生成，包括面部图像。

通过采用对抗性损失，可以将低维噪声向量输入[10]，时尚设计编码

[59]，不现实的渲染面部图像[28]或文本描述[54]映射到真实图像。

Zhu等[57]已经表明，通过添加循环一致性损失，CycleGAN在学习两

个域之间的转换函数方面取得了令人印象深刻的结果。最近，

Mueller

et al

.[27]利用几何一致性损失来保留基于CycleGAN的手部姿势

我们的方法是不同的，直接采取图像到图像的几何潜空间上的翻译，

而不是添加一个辅助的几何约束。Xu等[53]应用CycleGAN来学习特定

人对之间的转换。他们在不同的面部组件上添加了特定的鉴别器，以

增强每个局部部分的性能。与[53]相比，我们的ReenactGAN首先将所

有人脸映射到边界潜在空间中，然后将其解码到每个特定的人。利用

所提出的目标特定Transformer，每个解码器可以基于自适应的边界空

间将任意人再现到特定目标，从而高效且方便地实现多对一的再现引

入边界空间也提高了面部动作的一致性和极端姿态的鲁棒性。

通过边界转移的

拟议的框架ReenactGAN如图2所示。ReenactGAN可以分为三个组件：

边界编码器、目标特定的

剩余16页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

ReenactGAN：学习驱动的面部再现框架实证研究

基于人脸图像超分辨率重构算法的研究

基于深度学习的人脸识别的研究

人脸模型重建

FaceNet：深度学习人脸识别技术

MTCNN：深度学习人脸检测与对准技术

DeepID2：深度学习人脸识别算法解析

提高鲁棒性的ELQP：改进LBP人脸识别算法研究

LUVLiFaceAlignment：深度学习人脸关键点定位与不确定性估计

列车司机疲劳驾驶检测：基于人脸特征的识别系统研究

beego-FaceRecognition:基于beego框架的人脸识别系统

最新资源