传播LSTM网络：基于联合相关性的三维人体姿态精确估计

79 浏览量更新于2024-06-20 收藏 1.35MB PDF 举报

"本文主要介绍了基于联合相关性的传播LSTM网络(p-LSTM)在三维人体姿态估计中的应用，由延世大学的研究团队提出。这种方法利用关节间的结构连接性，即联合相互依赖(Joint Interdependence, JI)，在深度学习框架内，特别是LSTM架构，来提高姿态估计的精度。" 在三维人体姿态估计问题中，传统的2D姿态估计仅仅关注关节在二维图像上的位置，而3D姿态估计则需要进一步确定人体关节在三维空间中的坐标。早期的方法依赖于手工特征或有限视角的数据，而现代深度学习方法可以从图像中直接估计3D姿态，且通常表现出更好的性能。传播LSTM网络(p-LSTM)是为了解决这些问题而提出的创新解决方案。它通过LSTM单元的序列连接，逐级重建从质心到边缘关节的3D深度信息。在第一个LSTM中，先生成3D姿态的“种子”关节，然后通过后续的LSTM单元传播并重建整个身体的关节位置。这种方法的关键在于利用JI，即关节间的结构依赖性，来学习和理解人体姿态的空间相关性，从而减少结构误差，提升姿态估计的准确性。与现有技术相比，p-LSTM在最大公共可用数据库上实现了约11.2%的准确性提升。这表明，考虑到关节依赖性的方法对于减少错误和提高3D人体姿态估计的精确性具有显著作用。通过这种技术，可以应用于运动捕捉、虚拟现实、康复医学和3D建模等领域，为这些应用提供更准确的人体动态信息。关键词的涵盖范围很广，包括3D人体姿态估计、联合相互依赖、LSTM以及传播LSTM网络。这些关键词揭示了研究的核心内容，即使用深度学习技术，特别是LSTM的变体，结合关节间的结构信息来提升3D姿态估计的性能。虽然现有的工作已经取得了一定的进步，但忽视关节依赖性可能导致性能下降，而p-LSTM正是为了解决这一问题而设计的。通过引入结构连接性，网络能够更好地理解和预测人体姿态，从而实现更精确的3D定位。

K. Lee等人

一些作者手动地利用先验知识，诸如运动学模型、

身体模型和结构

原理

[

，

- 31]

。

这种应用支持

我们的信念，即当姿态的维度从2D增

加到3D时，先验知识是有效训练深度学习模型的有用信息。Zhou

等

人。

[5]将运动模型层嵌入CNN。然而，由于模型的非线性，参数难

以设置。此外，该方法需要严格的假设，如固定的骨长度和已知的规

模。Bogo

等人

[30]提出了一种优化过程，以将[ 3 ]中估计的2D姿势拟

合到3D人体模型[37]中。 Moreno

等人

[29]将输入2D姿态从基于关节位

置的向量转换为基于关节的欧几里得距离的N × N矩阵。 Sun

等人

[31]

将成本函数从每关节误差改变为每骨骼（肢体）误差，然而，据我们

所知，该方法[ 31 ]的性能目前在姿态估计误差方面最高。

然而，传统的方法忽略了从人体的空间和时间行为观察到的关节

的相互依赖性的角度来看的重要概念也就是说，[29，31]中的作者已

经利用全身水平的结构连接性作为先验知识。与之前的工作不同，我

们的新颖之处在于将基于身体部位的关节连接嵌入到深度学习结构

中，以更准确地重建3D姿态。

三维位姿估计方法

3.1

系统架构

图2说明了我们的方法的系统架构该方法由两个深度学习模型组成，

分别用于2D和2D到3D姿态估计。CNN从图1中的输入RGB图像中提取

2D姿态作为特征。第2段（b）分段。然后，由9个p-LSTM串联组成

的所提出的p-LSTM进行源自提取的2D姿态的2D到3D姿态估计，如图

1B所示。第2段（d）分段。第一个3D姿态在全连接层（FC）中构

建。最后，3D姿态通过2D到3D姿态估计模块的多级架构被进一步细

化，2（g）和（h）。

3.2

问题陈述

我们的方法的主要目的是从一个给定的2D输入图像估计的3D人体姿

态信息。为此，需要大量的图像和对应的3D GT姿态数据。通常，2D

人体姿势给出了比原始图像中捕获的人体姿势更抽象的人体姿势表

示。因此，借助于2D姿态的2D到3D姿态估计在3D姿态形成时是有效

的

[

，

- 27，29 - 31]

。

我们

采用了[2]中的

二维

姿态

估计方法，如图1所示。第

2段（b）分段。在本文中，我们的方法的目的是学习一个映射函数

：R

→

通过添加一个深度维度的2D姿态与

关节。映射函数使

用2D姿态X的2J个向量作为输入，并且使用3D姿态Y的3J个向量作为

输出，其中分别

[

，

···

，

]和

[

，

···

，

]。我们的方法的主要目

标是设计函数

作为深度回归。

剩余16页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

传播LSTM网络：基于联合相关性的三维人体姿态精确估计

时间序列信息提升三维人体姿态估计精度

基于LSTM神经网络的TensorFlow人体动作分类研究

深度学习框架：基于关节深度预测的单眼3D人体姿态估计

基于时空相关性的LSTM 算法及PM2. 5 浓度预测应用.pdf

在三维人体姿态估计中，传播LSTM网络是如何利用联合相互依赖性提升姿态估计的精度的？

传播LSTM网络在3D人体姿态估计中是如何应用联合相互依赖(JI)以及长短期记忆(LSTM)网络来提升姿态估计精度的？

考虑空间相关性采用LSTM神经网络的光伏出力短期预测方法.pdf

基于三维人体姿态估计的老人跌倒检测之计算机研究.docx

基于keras实现的LSTM网络

基于CNN+LSTM网络用于可变长度的手写数字识别算法python源码.zip

最新资源