密集引导图监督下的手姿态估计新框架

45 浏览量更新于2024-06-20 收藏 1.68MB PDF 举报

"这篇论文提出了一种名为HandMap的新手姿态估计框架，它引入了中间密集引导图监督的概念，以提高2D和3D手姿态估计的准确性。该框架结合了基于回归和基于检测方法的优点，解决了现有方法中如热图分辨率限制导致的精度问题。" 在手姿态估计领域，鲁棒的估计对于各种应用至关重要，例如虚拟现实、混合现实、计算机游戏和无接触用户界面。随着3D传感和机器学习技术的进步，大量标注的手部姿势数据集得以创建，推动了复杂网络结构在处理这一挑战性任务上的发展。目前的方法主要分为基于回归和基于检测两类。基于回归的方法直接预测关节的3D坐标，而基于检测的方法则通过生成关节位置的热图来进行估计。然而，基于回归的方法面临高度非线性映射的难题，而基于检测的方法受制于热图的分辨率，这限制了其精度。论文作者针对这些问题，提出了一个创新的解决方案——HandMap框架。这个框架采用了一个中间的、密集的特征引导图来监督学习过程，旨在捕获手部的几何形状和局部关节与全局手部结构的空间关系。 HandMap的流程包括从单个深度图像开始，通过堆叠残差模块来提取低维度特征。与传统的直接回归关节坐标的方法不同，HandMap在输入图像中密集地采样有意义的几何约束，这些约束为特征表示提供了连续的指导。这种方法有助于正则化学习问题，使得估计更加稳健。具体来说，HandMap的虚线所示部分展示了如何在特征空间中联合预测，形成一个中间监督模块，为基于回归的管道提供约束。这种方法能够克服热图分辨率限制，提升估计的准确性和鲁棒性。在实际应用中，这将意味着手部姿态的识别将更为精确，对于需要高精度手势识别的应用来说是一个重大进步。关键词：手姿态估计，密集引导图，中间监督，回归方法，检测方法，深度图像处理，鲁棒性总结来说，这篇论文贡献了一种新的手姿态估计策略，通过中间密集引导图监督改进了基于回归和检测的现有方法，提升了从单个深度图像估计手部姿势的精度和稳定性，有望在人机交互等领域产生积极影响。

X. Wu，D.Finnegan，E. L. 杨

等人

[13]

基于增强的网络架构、数据增强和更好的初始手部定位来估计

手部姿势。

Madadi

等人

[11]

利用分层树状结构

CNN

从局部姿势估计手关

节。与将深度数据视为

图像的上述方法不同，

Ge et al.[14]

基于来自三

个规范视图的投影距离场训练

3D CNN

以回归手关节位置。与回归相比，

基于检测的方法预测每个关节的概率密度图。

Tompson

等人

[1]

使用

CNN

预测关节位置的概率分布作为热图。

等人

[5]

通过使用来自多个视图的

深度信息来扩展该方法。

Moon

等人。

[30]

使用

3D CNN

来估计每个关节

的每体素可能性，与之前基于

2D CNN

和手部关节回归的方法相比，在

“HANDS 2017”

挑战中获得了最佳的整体性能

根据

[19]

中的估计误差统计，鉴于前三个估计结果都是基于检测的，

基于检测的方法似乎优于基于回归的方法这反映了深度图与

手关节坐

标之间的高度非线性映射的困难。仅仅依靠神经网络来进行联合回归是

不够的。另一方面，在我们的手部姿势估计实践中，我们认识到，由于

用于联合分布的预测热图的有限分辨率，基于检测的方法也具有其自身

的限制，使得难以识别单个图元素内的准确手部位置（即，

中的像素

或

中的体素）。人体姿势估计中的最近工作提出了多任务设置中的组

合框架

[31

，

32]

，但是在手部姿势估计中采用类似思想的性能仍然是未

知的。在这项工作中，我们利用多阶段多目标框架的优势来攻击特定领

域的挑战，从而提高准确性和鲁棒性。

Zeiler

等人

[33]

假设神经网络的中间输出可以用于表示从网络的整体输

入中提取的特征从这一点上，我们假设，充分良好的设计功能可以作为

一个神经网络的中间层的良好

Newell

等人

[20]

采用了

中间监督

的思想，

并

在他们的工作中测试了

人体姿态估计，但

他们的结果仅限于

，难以解

决深度模糊问题。我们建议通过在密集指导地图监督模块之后添加回归

阶段来结合基于检测和回归的方法，以稳健地输出

关节位置。我们的

姿态估计系统从

[19]

中报道的基于检测的方法中获得了更高精度的好

处，但我们对特征空间而不是输出空间施加了中间约束

混合方法

使用生成式方法执行时间手部跟踪，而如果误差累积，则通过判别

式方法重新初始化跟踪。已经使用了各种重新初始化策略，包括粒子群优化

[29]

，深度神经网络

[1]

，随机蕨类植物和森林

[34]

以及检索森林

[26]

。

剩余17页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

密集引导图监督下的手姿态估计新框架

基于密集预测和基于关键点估计

现在都有哪些开源的人体姿态估计库

推荐20个姿态估计深度学习模型

你知道关于人体姿态估计有关的开源库？

视频中人体姿态估计的国内外研究现状4000字

人体姿态估计多线程实现实时性，python代码实现

人体姿态识别常用模型库

基于One-stage框架模型历史

有什么常见的基于CNN的关键点检测算法

基于envi监督分类提取郑州市道路的分析结果

最新资源