深度学习驱动的姿势引导人体图像修复与再合成

PDF格式 | 1.34MB | 更新于2025-01-16 | 31 浏览量 | 举报

"这篇论文提出了一种新的深度学习方法，专注于姿态引导的人体图像纹理修复，用于人体照片再合成。该方法特别适用于处理因姿态变化而导致的图像修复问题，尤其在增强现实和零售领域有广泛应用前景。" 文章的核心是介绍了一种深度学习技术，它能以新的姿势和视角重新合成人体图像。此技术由两个深度生成的卷积神经网络（ConvNets）组成。第一个网络负责从输入图像中的一小部分纹理来估计整个身体表面的纹理，即纹理完成或修复。由于输入图像通常只能看到人体的一部分，因此需要一种方法来推断并填充未观察到的区域。针对这一挑战，论文提出了一种新颖的纹理估计策略，利用了人体的自然对称性。传统的方法，如直接的图像到图像转换，往往在处理未知位置的颜色预测时产生模糊的纹理，因为颜色会在大量输入位置上被平均。为了解决这个问题，提出的修复网络并不直接处理纹理元素的颜色，而是估计输入图像与纹理之间的对应关系。这些对应关系随后会被扭曲到目标图像的坐标系中，以适应新的姿态，即使在大幅度的姿势变化下也能有效地建立源视图和目标视图之间的联系。第二个卷积网络则利用这些建立的对应关系和其他可用信息来合成最终的输出图像。在这个过程中，采用了一种全卷积架构，并结合了可变形的跳跃连接，这些连接由估计的对应字段引导。这种方法有助于在合成过程中保持细节和一致性。论文还展示了这种技术在姿态引导图像合成、服装转移以及姿势引导的人脸重新合成方面的最新成果，表明了该方法的有效性和广泛的应用潜力。通过对人体自然对称性的利用和对纹理元素对应关系的精确估计，这种方法能在姿态变化剧烈的情况下，提供高质量的图像重合和修复效果。这项工作为姿态引导的图像处理提供了新的见解和技术，特别是在人体纹理恢复和图像合成方面，对于增强现实应用和虚拟试衣间等场景具有重大意义。通过深度学习和创新的网络设计，研究人员能够克服传统方法的局限，实现更加逼真和精确的图像再合成。

展开

12137

此刻适应输入数据中存在间隙的卷积架构的特殊变体

包括Sheppard网络[24]，稀疏不变CNN [31]，部分卷积

网络[17]，门控卷积网络[35]。我们将后一种变体用于

我们的纹理修复网络。学习身体纹理修补有两个特定

的部分，区别于一般的图像修补。首先，完整的纹理

可能不容易获得，并且期望设计一种可以从部分图像

训练的方法。其次，纹理在空间上是对齐的，并且具

有可利用的对称结构，这需要专用的算法。我们知道

只有少数作品专门处理这些挑战。因此，UV-GAN [3]

通过将图像及其翻转副本传递到图像修复ConvNet来利

用面部的主轴[36]中的系统估计与SMPL模型顶点具有

相似颜色的概率相对应的概率，并使用它来用未观察

到的颜色对顶点进行着色。

服装转移。我们还表明，我们的方法的一个小的修

改，可以用来转移衣服从一个人的照片，以不同的姿

势不同的人的照片。大多数现有的工作，uti-神经网络

只能处理非常有限的变形量之间的源图像和目标视图

[12，15，32]。我们所知道的唯一可以处理类似数量

的姿势变化的工作是SwapNet [23]，然而它只在低分辨

率下呈现结果。我们在实验部分与[23

面部再合成我们的方法涉及到一些最近的人脸再合成

工程，通过扭曲输入图像到输出图像。这些作品包括

图2.使用基于颜色的补绘（中）和基于坐标的补绘（右）对

保留集（左）上的输入估计的身体表面纹理。这两种修复都

是使用深度网络生成的，这些深度网络是用各种标准损失进

行端到端训练的。基于坐标的修补生成具有更多细节的纹

理，从而获得更好的最终重新合成结果。

真实的位置是已知的。因此，我们假设对于源图像中

（相应地在新图像中）的每个像素[x

，

y]，存在与

，

y]相关联的映射

，

y]（相应地M

[x，y]），

位置

，

v]=[M

，

y]]

（分别地，

，

v]=[M

，

y]]

）在tex上

[27]和X2Face [34]。一个较老的工作可以追溯到开创

性的Blanz和Vetter变形模型[1]，使用参数模型从其片

段中估计面部纹理

方法

问题表述。我们的目标是从源视图

合成人

的新视

图。通过估计纹理

来

进行再合成。下面，我们使用索

引

，

来表示图像帧中的位置（源视图和新视

图），并使用索引

，

来表示纹理中的位置。我们

将源和目标图像元素和位置称为

像素

，并将纹理元素

和位置称为

纹素

。

纹理与源和新视图相关联，并且下面[22]我们假设

对于源和新视图，从覆盖身体的像素子集（不包括头

发和宽松的衣服）到身体纹理的映射

是的。对于不落在投影内的像素[x

，

y]，

对于人体，映射M

和M

是未定义的。

我们假设

，

y]和

，

y]被给出，并且我们的

目标因此是在给定其主体纹理映射

，

y]以及已知

源视图S及其主体纹理映射MS

的

情况下估计新的未知视

图N。

纹理贴图格式和输出条件。我们使用SMPL纹理格式

[19] 。为了使我们的方法与 [22] 相比较，我们基于

DensePose [11]估计

映射

和

，然后使用预定义的映

射（与DensePose一起提供）将它们转换为 SMPL坐

标。因此，与[22]不同的是，我们在转移过程中使用

单个身体然而，用于对源和目标姿态进行编码的信息

是完全相同的（密集姿态编码），使得方法直接可比

较。

下载后可阅读完整内容，剩余11页未读，立即下载

身份认证购VIP最低享 7 折!

30元优惠券

cpongm

粉丝: 5

深度学习驱动的姿势引导人体图像修复与再合成

基于纹理方向的图像修复算法

一种基于纹理的图像检索方法

纹理图像修补

EPS点云纹理映射：3技巧增强真实感

图像处理新手必读：Windows 10上的OpenMVG+OpenMVS入门指南

LabVIEW图像预处理升级：掌握这些技术让你的视觉系统更精准

Python遥感图像变化检测：数据集制作与模型训练的完整流程

【图像识别技术】：工业视觉检测中的应用方法与案例研究

【3D重建技术】：计算机视觉中的图像到模型转换技术全览

纹理合成的图像修复方法

最新资源