软门翘曲GAN:解决几何变化的姿势引导人像合成

0 下载量 155 浏览量 更新于2024-08-26 收藏 2.34MB PDF 举报
"这篇研究论文提出了一种名为软门翘曲生成对抗网络(Warping-GAN)的新方法,专门用于解决在大型几何变换下的图像合成问题,特别是针对以任意姿势为条件的人像合成。在人像合成领域,现有的生成模型在处理复杂的姿势变换时往往表现不佳,因为它们不能有效地处理重度遮挡、不同视角和外观显著变化等挑战。Warping-GAN采用两阶段策略,首先合成目标姿势的分割图,然后利用软门翘曲块进行特征级映射,将原始图像的纹理渲染到生成的分割图上。这种方法能够适应不同的变形程度,并且其轻量级和灵活性使得软门翘曲块可以融入任何网络架构。实验结果表明,Warping-GAN在人体感知和定量评估中表现出优越性能,超过了现有的所有方法,在两个大型数据集上的表现尤为突出。" 本文的核心创新点在于软门翘曲块(Soft-Gated Warping Blocks)。这些块通过引入软门机制,能够更好地处理几何变化和空间位移,特别是在处理人体图像时的复杂姿态转换。软门机制允许在保持高级结构约束的同时,进行更灵活的特征映射。第一阶段,网络生成目标姿势的分割图,定义了各个身体部位的空间布局。第二阶段,软门翘曲块在特征级别工作,学习如何将原始图像的纹理准确地映射到由第一阶段生成的分割图上,从而实现高保真度的图像合成。 Warping-GAN的这种两阶段方法解决了传统模型中的局限性,尤其是在处理大规模几何变换时,能有效应对重度遮挡和不同视角带来的挑战。同时,由于其设计的通用性,软门翘曲块可以作为模块集成到其他网络中,增强了模型的适用性。实验部分,论文通过与现有方法的对比以及人体感知评估,验证了Warping-GAN在人像姿势引导的图像合成任务上的优越性能。 这项工作对于理解如何在图像合成中处理复杂的几何变换提供了新的见解,并为未来的研究提供了一个强大而灵活的工具。通过克服当前模型的局限,Warping-GAN有望在人像编辑、虚拟试衣、动画和游戏等领域产生广泛的影响。