MultiPoseNet：自下而上的高效多人姿态估计框架

35 浏览量更新于2024-06-20 收藏 2.83MB PDF 举报

MultiPoseNet是一种创新的自下而上的多人姿态估计框架，它在计算机视觉领域引起了广泛关注。该研究由Muhammed Kocabas、Salih Karagoz和Emre Akbas三位学者在中东技术大学计算机工程系提出，他们设计了一个高效且精确的系统，旨在联合解决人检测、人体分割和姿态估计这三个关键任务。核心贡献在于提出了一种新的关键点分配方法，即姿态残差网络（PRN）。PRN能够接收关键点信息和人体检测结果，通过一种有效的策略将这些关键点精确地分配到每个个体上，从而提高姿势估计的准确性。这种方法的优势在于它能够在保持高精度的同时，显著提升处理速度，尤其是在与先前的自下而上方法相比时，其在COCO关键点数据集上的性能表现优秀，mAP得分比最佳先前结果高出4个百分点，而且速度至少快4倍。相比于传统的自上而下方法，如先检测人再进行单人姿态估计，自下而上的方法虽然在速度上可能稍逊一筹，但MultiPoseNet由于采用了多任务学习的策略，能够在一次处理中完成多个任务，减少了重复计算，使得整体效率得以提升。尽管如此，MultiPoseNet在速度上仍能与最好的自上而下方法相媲美，达到每秒23帧的实时性能，这在实时应用中具有极大的优势。总结来说，MultiPoseNet的创新之处在于其融合了高效的关键点分配策略和多任务模型，实现了准确性和速度的双重优化，为多人姿态估计领域开辟了新的可能性。这对于需要实时处理大量图像数据的应用，如视频监控、运动分析和虚拟现实等领域具有重要意义。在未来的研究中，MultiPoseNet的方法可能会进一步推动计算机视觉技术的发展，特别是在对效率和准确性有较高要求的场景中。

M. Kocabas、S.Karagoz和E.阿克巴

斯

基于模型[3，7，13，24，33，38，45，46，48，51]的研究在Toshev等

人的初始工作之后迅速主导了姿态估计问题。[46]他使用AlexNet架构

直接回归空间关节坐标。Tompson等人[45]通过将深度特征与图形模

型相结合来学习姿势结构。Carreira等人[7]提出了迭代误差反馈方法

来训练卷积神经网络（CNN），其中输入与当前预测一起重复馈送到

网络，以便改进预测。Wei等人。[48]受到姿势机器[43]的启发，并使

用CNN 作为姿势机器中的特征提取器由 Newell 等人开发的

沙漏块

（HG）[38]基本上是具有残余连接的卷积-去卷积结构Newell等人堆叠

HG块以获得迭代细化过程，并显示其对单人姿态估计的有效性。堆

叠沙漏（SHG）的方法取得了显着的性能比以前的结果增加。Chu等

人。[13]建议添加视觉注意力单元以关注感兴趣的关键点区域杨等人

的金字塔剩余模块[51]改进了SHG架构以处理尺度变化。Lifshitz等人

[33]使用来自图像位置的概率关键点投票方案来获得针对每个身体部

分的协议图。Belagiannis等人[3]介绍了一种简单的基于递归神经网络

的预测细化架构。Huang等人[24]开发了一个以Inception-v2 [44]网络为

骨干的粗到细模型。作者计算了网络每一级的损失，以学习从粗到细

的部件表示。

2.2

多人姿态估计

自下而上的多人姿态估计解决方案分为自下而上和自上而下的方法。

自下而上的方法检测身体关节并将其分配给人实例，因此与自上而下

的方法相比，它们在测试时间上更快，尺寸更小但是，他们错过了放

大每个人员实例的详细信息的机会这在自上而下和自下而上方法之间

产生了准确性差距。在Ladicky et al.[32]，他们提出了一种使用基于

HOG的特征和概率方法联合预测人体部位分割和部位位置的算法。

Gkioxari等人[20]提出了k-poselets来联合检测人和关键点。大多数最近

的方法使用卷积神经网络（CNN）以端到端的方式检测身体部位及其

之间的关系[6，25，37，41，42，47]，然后使用分配算法[6，25，

42，47]来形成个体骨架。Pischulin等人[42]使用深度特征来联合预测

部件位置和与所述模型的关系

，所述模型被形成为相关的

。

尽管

[

42]

没有使用人员检测，但由于提出的聚类算法

，

它非常慢，处理时间大

约为几

个

在Insafutdinov等人的后续工作中。[25]，它们受益于更深的

ResNet架构作为部分检测器，并通过增量优化策略提高了先前方法的

解析效率。与Pischulin和Insafutdinov不同，Iqbal et al.[27]提出局部求解

稠密连接的图形模型，从而改进了

剩余16页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

MultiPoseNet：自下而上的高效多人姿态估计框架

Python-MultiPoseNet使用姿态残差网络进行快速多人姿态估计

CrowdPose 多人姿态估计数据集

重温基于图的协同过滤：一种线性残差图卷积网络方法，AAAI2020.zip

多人人体姿态估计-基于Pytorch实现的实时多人形体姿态估计算法-附项目源码-优质项目实战.zip

regout:基于外部学生化残差 R-student 的回归分析的异常值测试。-matlab开发

一种基于非残差估计线性表示模型的人脸识别.pdf

递归残差：该函数是递归残差方法的一种实现，用于检测线性回归中的异常值。-matlab开发

一种基于非残差估计线性表示模型的人脸识别 (2014年)

一种基于深度残差卷积神经网络的歌声检测算法.pdf

MS-LSSVM提升多元变量质量诊断：一种高精度残差控制图方法

最新资源