内空间保持生成：高精度图像中姿势重置的ISP-GPM

9 浏览量更新于2024-06-20 收藏 1.4MB PDF 举报

本文探讨了一种创新的图像处理方法，名为"内部空间保持生成式姿态机"（ISP-GPM），由刘双军和莎拉·奥斯塔达巴斯在波士顿东北大学电气与计算机工程系的增强认知实验室开发。该研究专注于在保持图像内容完整性和高精度的前提下，对图像中的人体姿势进行生成或重置，尤其是在复杂的背景下和存在遮挡的情况下。通常，基于图像的生成技术，如生成对抗网络（GANs），在图像合成方面表现出色，特别是当它们能够控制图像的上下文时。然而，这些技术大多假设背景简单且人物姿势变化有限，这限制了它们在现实场景中的应用。为了克服这一局限性，研究者们引入了可解释的低维姿态描述符（LDPD），将图像中的关节关系转化为一种数学表达，以此来代表图像中的"图像空间"。 ISP-GPM利用条件GAN结构，结合多级增强的沙漏网络，将原始图像和LDPD结合起来，实现了对人物姿势的精细操控。这种模型允许在保持背景细节精确的同时，合理地恢复被遮挡的身体部位，使得图像中的主体可以在不同的姿势下呈现，同时保持整体的视觉连贯性。研究人员针对此模型进行了实验验证，特别是在静止数据集上，他们使用最先进的姿态估计算法进行评估，结果显示在PCK0.5度量标准下，ISP-GPM的性能超过了80%，显示出其在复杂场景下保持高精度的能力。此外，这项工作还展示了生成式姿态机如何通过"内空间保持"特性，对图像进行有选择性的修改，增强了图像的表达力和创造性。关键词：条件生成对抗网络（cGANS）、内空间保持、生成姿势模型、关节表示，共同构成了这篇论文的核心内容。这项研究成果对于计算机视觉领域，尤其是图像编辑和增强现实应用具有重要的理论和实践价值。

S. Liu和S. 奥斯塔达巴

斯

“

位姿”概念是一种更一般的形式，其中，位姿不是单个刚体的整

体，而是图像中存在的所有物理实体与其背景之间的相对关系。我

们把边界推到一个极端的情况下-一个高度铰接的对象（即。人

体）相对于自然背景（代码可在[2]获得）。ISP-GPM的直接结果

是，通过改变图像中的姿态状态，我们可以实现对原始世界的无

限生成再解释，这最终导致一次性ISP数据增强。

相关工作

改变姿势在我们的物理世界中非常常见。如果我们拍照随着时间的

推移，它们几乎不可能相同。这些图像由于具有相对静态的背景

而共

享强相似性，其中仅由对象的姿势中的变化引起的差异

。

我们可以

保留

这

些差异，因为姿态信息部分地反映在这些图像中。然而，真正的“寄

托”实际上发生在3D空间中，并且2D映射只是之后的简单投影。这

一事实激发了Blender，Maya或3DS Max等3D渲染引擎在图形级别以

（半）精确尺寸模拟物理世界，合成其中的3D对象，将对象放置在

3D中，然后最终使用虚拟相机从放置的对象渲染2D图像[37]。在这个

流水线之后，最近尝试生成合成的人类图像[51，61，63]。SCAPE方

法使用多个姿势的人的密集3D扫描将人体形状参数化为通用模板

[5]。[11]中的作者将服装照片映射到SCAPE模型中，以增强人体3D姿

势数据集。物理渲染和真实纹理在[64]中组合以生成合成人类数据

集。然而，这些方法不可避免地需要复杂的3D渲染引擎，并且需要

来自使用特殊设备的全3D扫描或从一般化模板生成的化身数据[39，

5]，这意味着这样的数据不容易访问或扩展到新颖的图形。

基于图像的生成方法，如GAN和VAE已经能够生成具有大量上下

文控制的逼真图像，特别是当它们被调节时[27，7，54]。还存在解决

刚性的姿势问题的作品（例如，[14]或单独（例如，面[68]）对象。

在[35]中采用了用于捕获移位或旋转变化的自动编码器结构，其成功

地再生了具有姿势移位的2D数字和3D图形渲染图像的图像深度卷积

逆图形网络（IGN）[33]学习图像的可解释基于IGN概念，Yang采用了

一种递归网络来将平面外旋转应用于人脸和3D椅子，以生成新图像

[68]。在[15]中，作者构建了一个用于椅子视图渲染的卷积神经网络

（CNN）模型，该模型可以在给定的视点之间进行插值，以生成缺失

的视点，或者通过在训练集的椅子之间进行插值来发明新的椅子样式

3D MORE-

剩余17页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

内空间保持生成：高精度图像中姿势重置的ISP-GPM

通过深度图像识别人体姿势

基于模型的深手姿势估计

当机器人的姿势已知时，采样的 LIDAR 读数用于生成占用网格图附matlab代码.zip

自适应SLIC算法提升人体标准姿势图像分割精度

基于Gabor低秩恢复的高精度人脸识别方法

多视角深度图后处理提升人体姿势估计精度

人物检测与姿势估计系统分析与实现

动态表面函数网络：捕捉着装人体的姿势变形

yolov8人姿态识别数据库发布：四类姿势清晰标注

CMAC小脑模型在非线性模型识别中的应用研究

最新资源