Adversarial PoseNet:深度网络中的人体结构感知姿态估计

0 下载量 89 浏览量 更新于2024-08-30 收藏 828KB PDF 举报
"Adversarial PoseNet: 一种结构感知卷积网络用于人类姿态估计(2017)" 本文介绍了一种名为Adversarial PoseNet的新型结构感知卷积网络,该网络旨在解决人类姿态估计中的挑战,特别是考虑到人体关节的几何约束关系。在深度网络的训练过程中,该方法能隐式地利用这些先验知识,提高预测的准确性。 1、结构感知卷积网络:Adversarial PoseNet引入了一个新颖的架构,它不仅基于深度卷积神经网络(DCNN),而且能够理解并利用人体关节之间的结构信息。这种结构感知能力使得网络在处理遮挡或复杂背景时能更好地预测人体姿态。 2、生成器与判别器:Adversarial PoseNet使用了条件生成对抗网络(CGANs)的训练策略。生成器(Generator)预测人体姿态(pose)和遮挡热力图(occlusion heatmaps),然后将这些预测输入到判别器(Discriminator)。判别器的任务是区分生成器预测的姿态与真实姿态,以此来推动生成器学习更接近真实的人体姿态分布。 3、学习目标:理想情况下,如果生成器生成的结果能让判别器无法区分真假,那么网络就成功地学习到了人体结构的先验知识。这种对抗性学习过程有助于网络生成更为合理、符合人体解剖学的姿势估计结果。 4、传统DCNN的局限性:虽然DCNN在人类姿态估计领域取得了显著的进步,但在处理遮挡和相似背景的情况下,它们往往难以生成精确的热力图。为了克服这一问题,Adversarial PoseNet借鉴了人类视觉系统的优点,尝试将人体结构的先验知识融入网络。 5、隐式学习先验知识:直接学习这些先验知识是具有挑战性的,因此Adversarial PoseNet提出通过一个“判别器”来隐式学习。这个判别器可以判断预测的姿态是否在几何上合理。如果DCNN回归器能够“欺骗”判别器,使其认为所有预测都是合理的,那么网络就成功地学习了人体结构的先验知识。 6、受GANs的启发:Adversarial PoseNet采用了类似于生成对抗网络的框架,这源于【23,38,26,11,8】等研究,这些研究证明了在无监督或半监督学习中,GANs能有效地学习复杂的数据分布。 通过这样的对抗性训练,Adversarial PoseNet旨在提升人类姿态估计的准确性和合理性,特别是在面对遮挡和复杂环境时。这一方法对未来的计算机视觉研究,尤其是在人体行为理解和交互式系统中有重要的应用价值。