LASOR:通过合成遮挡数据与神经网格渲染提升人体姿态和形状精准度

需积分: 4 0 下载量 176 浏览量 更新于2024-08-04 收藏 39.75MB PDF 举报
本文介绍了一种名为LASOR(Learning Accurate 3D Human Pose and Shape Via Synthetic Occlusion-Aware Data and Neural Mesh Rendering)的新方法,它旨在解决3D人体姿态和形状估计中的一个重要挑战——遮挡问题,包括自我遮挡、物体与人之间的遮挡以及人与人之间的遮挡。在实际场景中,尤其是在存在遮挡的情况下,缺乏多样性和精确的训练数据成为制约准确估计的关键瓶颈。 LASOR框架的核心创新在于其合成的遮挡感知的轮廓和2D关键点数据生成过程。通过这种方法,该模型可以直接学习SMPL(Skinned Multi-Person Linear Model)的人体姿态和形状参数,而不是依赖于有限的现实数据。利用神经3D网格渲染技术,LASOR能够实时进行轮廓监督,这显著提高了形状估计的精度。 此外,为了弥补现有数据在视角多样性方面的不足,LASOR还提出了一种生成全景视角的关键点和轮廓驱动训练数据的方法。这种策略使得模型能够更好地理解和处理不同视角下的遮挡情况,从而增强了对复杂场景中人体姿势和形状的估计能力。 LASOR通过结合合成数据和智能渲染技术,克服了遮挡问题,提升了3D人体姿态和形状估计的准确度,并且通过增加视角多样性的训练数据,使得模型在各种遮挡场景下都能展现出优越的表现。这项工作对于推动计算机视觉领域的人体理解研究具有重要意义,尤其是在动作捕捉、虚拟现实和增强现实等应用中。