传播LSTM网络:基于联合相关性的三维人体姿态精确估计

0 下载量 5 浏览量 更新于2024-06-20 收藏 1.35MB PDF 举报
"本文主要介绍了基于联合相关性的传播LSTM网络(p-LSTM)在三维人体姿态估计中的应用,由延世大学的研究团队提出。这种方法利用关节间的结构连接性,即联合相互依赖(Joint Interdependence, JI),在深度学习框架内,特别是LSTM架构,来提高姿态估计的精度。" 在三维人体姿态估计问题中,传统的2D姿态估计仅仅关注关节在二维图像上的位置,而3D姿态估计则需要进一步确定人体关节在三维空间中的坐标。早期的方法依赖于手工特征或有限视角的数据,而现代深度学习方法可以从图像中直接估计3D姿态,且通常表现出更好的性能。 传播LSTM网络(p-LSTM)是为了解决这些问题而提出的创新解决方案。它通过LSTM单元的序列连接,逐级重建从质心到边缘关节的3D深度信息。在第一个LSTM中,先生成3D姿态的“种子”关节,然后通过后续的LSTM单元传播并重建整个身体的关节位置。这种方法的关键在于利用JI,即关节间的结构依赖性,来学习和理解人体姿态的空间相关性,从而减少结构误差,提升姿态估计的准确性。 与现有技术相比,p-LSTM在最大公共可用数据库上实现了约11.2%的准确性提升。这表明,考虑到关节依赖性的方法对于减少错误和提高3D人体姿态估计的精确性具有显著作用。通过这种技术,可以应用于运动捕捉、虚拟现实、康复医学和3D建模等领域,为这些应用提供更准确的人体动态信息。 关键词的涵盖范围很广,包括3D人体姿态估计、联合相互依赖、LSTM以及传播LSTM网络。这些关键词揭示了研究的核心内容,即使用深度学习技术,特别是LSTM的变体,结合关节间的结构信息来提升3D姿态估计的性能。虽然现有的工作已经取得了一定的进步,但忽视关节依赖性可能导致性能下降,而p-LSTM正是为了解决这一问题而设计的。通过引入结构连接性,网络能够更好地理解和预测人体姿态,从而实现更精确的3D定位。