时间序列信息提升三维人体姿态估计精度

187 浏览量更新于2024-06-20 收藏 1.2MB PDF 举报

三维人体姿态估计是一项关键的计算机视觉任务，旨在从2D图像或视频中推断出三维空间中人体各部位的位置。近年来，深度学习技术在3D姿态估计领域取得了显著进步，但顶级方法往往采用两步法：首先通过先进的2D姿态估计算法获取图像中的二维关节位置，然后利用这些信息通过映射算法推断三维姿态。这种方法的优势在于，二维坐标具有良好的区分度，能够精确估计3D姿态。然而，单帧的3D姿态估计可能会因独立误差导致时间上的不一致性，即帧与帧之间的连续性缺失。为了克服这个问题，本研究论文探索了如何利用时间信息来增强序列到序列的三维姿态估计。作者James J. Little等人提出了一种基于层规范化LSTM单元的序列到序列网络结构，该网络利用快捷连接将输入信息直接传递到解码器，同时在训练过程中引入时间平滑度约束，以促进时间一致性。论文的核心贡献是设计了一种时间一致性模型，它在处理Human3.6M数据集时提高了大约12.2%的性能。这种方法允许网络在面对2D姿势检测器失败的情况下，还能恢复出时间连续的3D姿势序列，从而避免了因帧间不一致带来的问题。此外，3D姿态估计对于计算机视觉的高级任务，如动作识别、运动分析、增强现实和虚拟现实等领域具有重要意义，因为它们提供了更清晰、无遮挡的信息，有助于提升任务执行的精度和准确性。本文研究通过整合时间信息处理技术，改进了三维人体姿态估计的性能，并展示了其在实际应用中的优势，为该领域的研究提供了新的视角和解决方案。

作者：James J. 小

相关工作

姿态的

表示3D人体姿态的基于模型和无模型表示在过去都已被使

用最常见的基于模型的表示是由一组关节的运动树定义的骨架，由每

个关节相对于其父关节的偏移和旋转参数化。几种3D姿态方法已经

使用了这种表示[30，31，22，10]。其他人将3D姿势建模为基础姿势

的过完备字典的稀疏线性组合[21，20，19]。然而，我们选择了3D姿

态的无模型表示，其中3D姿态只是相对于根节点的一组3D关节位

置，如几种最近的方法[24，23，8，9]。这种表示方法简单得多，维

数也低得多。

从

关节估计

姿态

Lee和Chen [32]是第一个使用二叉决策树从给定

骨骼长度的2D投影推断Jiang [33]使用2D关节位置来估计一组

具有

姿

态的多个点，

这是使用Taylor

的

算法[ 34]

并且

使用

Gupta等人[35]以及

Chen和Ramanan [36]也使用了这种使用检测到的2D姿势来查询示例姿

势的大型数据库以找到最近的最近邻居3D姿势的想法。在给定2D姿

态的情况下估计3D关节位置的另一种常见方法是将相机姿态可变性

与人体的固有变形分离，后者通过从运动捕捉数据的大型数据库学习

基础3D姿态的过完备字典来建模[19，20，22，21，37]。一个有效的

3D姿态定义的稀疏的线性组合的基地，并通过使用表示相机外部参

数的变换矩阵变换的点。Moreno-Nouguer [23]使用2D关节的成对距离

矩阵来学习3D关节的距离矩阵，他们发现该距离矩阵在与地面真实

3D的刚性相似性变换之前是不变的，并使用具有姿态先验的多维缩

放（MDS）来排除模糊性。Martinez等人[24]设计了一个全连接网络，

每两个线性层有一个快捷连接，以估计相对于相机坐标空间中根节点

的3D关节位置。

随着深度网络的成功，许多人已经设计了可以端到端训练的网络，以

直接从图像预测3D姿势[7，8，6，14，9，15，10，38Li等人[8]和Park

等。[14]设计CNN来联合预测2D和3D姿势。梅塔等人[9]孙文，孙文。

[15]使用迁移学习将2D人体姿势估计的知识转移到3D姿势估计的任务

中。Pavlakos等人[7]扩展了最初设计用于预测每个关节的2D热图的堆

叠沙漏网络[18]，使其预测3D体积热图。Tome等人。[40]还扩展了称

为卷积姿态机（CPM ）[17]的 2D姿态估计器，使其预测3D姿态。

Rogesz和Schmid [39]和Varol等人。[38]使用合成图像和训练的CNN来

增强训练数据，以预测3D姿势

剩余16页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

时间序列信息提升三维人体姿态估计精度

基于三维人体姿态估计的老人跌倒检测之计算机研究.docx

基于深度学习的二维人体姿态估计综述.pdf

三维人体姿态参数EM估计仿真教程与操作视频

基于三维信息的人体姿态估计技术研究

在三维人体姿态估计中，传播LSTM网络是如何利用联合相互依赖性提升姿态估计的精度的？

PyTorch中3d人体姿态估计的简单基线_Python_下载.zip

结合模型匹配与特征跟踪的人体上半身三维运动姿态恢复方法

深度图像与BPOF特征在人体姿态估计中的应用

GAST-Net: 融合时空信息的3D人体姿态估计模型

深入了解3D人体姿态估计技术

最新资源