内空间保持生成:高精度图像中姿势重置的ISP-GPM

0 下载量 9 浏览量 更新于2024-06-20 收藏 1.4MB PDF 举报
本文探讨了一种创新的图像处理方法,名为"内部空间保持生成式姿态机"(ISP-GPM),由刘双军和莎拉·奥斯塔达巴斯在波士顿东北大学电气与计算机工程系的增强认知实验室开发。该研究专注于在保持图像内容完整性和高精度的前提下,对图像中的人体姿势进行生成或重置,尤其是在复杂的背景下和存在遮挡的情况下。 通常,基于图像的生成技术,如生成对抗网络(GANs),在图像合成方面表现出色,特别是当它们能够控制图像的上下文时。然而,这些技术大多假设背景简单且人物姿势变化有限,这限制了它们在现实场景中的应用。为了克服这一局限性,研究者们引入了可解释的低维姿态描述符(LDPD),将图像中的关节关系转化为一种数学表达,以此来代表图像中的"图像空间"。 ISP-GPM利用条件GAN结构,结合多级增强的沙漏网络,将原始图像和LDPD结合起来,实现了对人物姿势的精细操控。这种模型允许在保持背景细节精确的同时,合理地恢复被遮挡的身体部位,使得图像中的主体可以在不同的姿势下呈现,同时保持整体的视觉连贯性。 研究人员针对此模型进行了实验验证,特别是在静止数据集上,他们使用最先进的姿态估计算法进行评估,结果显示在PCK0.5度量标准下,ISP-GPM的性能超过了80%,显示出其在复杂场景下保持高精度的能力。此外,这项工作还展示了生成式姿态机如何通过"内空间保持"特性,对图像进行有选择性的修改,增强了图像的表达力和创造性。 关键词:条件生成对抗网络(cGANS)、内空间保持、生成姿势模型、关节表示,共同构成了这篇论文的核心内容。这项研究成果对于计算机视觉领域,尤其是图像编辑和增强现实应用具有重要的理论和实践价值。