PersonLab：自底向上的人体姿态估测与实例分割新法

84 浏览量更新于2024-06-20 收藏 2.81MB PDF 举报

PersonLab是一个创新的深度学习模型，专注于在多人图像中同时实现人体姿势估计和实例分割。该模型由乔治·帕帕纳德罗乌、泰勒·朱、梁池·陈、斯皮罗斯·吉达里斯、乔纳森·汤普森和凯文·墨菲等人在Google Research团队共同开发，他们利用了自下而上的策略，这是一种与传统的自上而下方法（首先检测物体，然后在对象内进行细分）不同的方法。模型的核心特点是基于部分的建模，它利用卷积神经网络（CNN）的能力来检测关键点并预测它们之间的相对位置。这种设计使得模型能够将关键点有效地组合成人体姿势实例，增强了对复杂姿势的理解和准确度。此外，部分诱导的几何嵌入描述符进一步强化了模型的性能，它将语义级别的像素与相应的实例关联起来，从而提供了实例级别的人体分割，这对于精确识别个体在场景中的位置至关重要。 PersonLab采用了一种完全卷积的架构，使得推理过程高效且与场景中的人数无关，这在实时应用中具有很大的优势。经过在COCO数据集上的训练，单尺度推理时，PersonLab在COCO测试开发集上达到了0.665的关键点平均精度，而多尺度推理则提高了到0.687，这明显优于之前的所有自下而上方法。对于实例分割任务，尤其是人类实例分割，它实现了人类平均精度达到0.417，这是自下而上方法中的一个突破性成就。 PersonLab代表了在多人场景中进行细致视觉理解的重大进展，它的成功在于结合了有效的局部特征处理、实例关联和整体架构设计，为计算机视觉领域的多个任务提供了强有力的支持，包括智能照片编辑、活动识别、虚拟现实和机器人技术等。

G. Papandreou，T.朱湖，加-地C. Chen，S.放大图片作者：J. 墨

菲

分割和聚合来自密集的多尺度块的分割结果，并且将局部块聚合成完

整的对象实例。Levinkov等人[58]将实例分割问题公式化为由图分解

和节点标记组成的组合优化问题，并提出有效的局部搜索算法以迭代

地细化初始解。实例-切割[59]和[60]的工作提出预测对象边界以分离

实例。[2，61，62]将学习的嵌入空间中具有相似值的像素预测分组

Bai和Urtasun [63]提出了一种分水岭变换网络，该网络生成一个能量

图，其中对象实例表示为盆地。Liu等[64]提出了顺序分组网络，将实

例分割问题分解为若干子分组问题。

方法

图1给出了我们的系统的概述，我们将在下面详细描述

3.1

人物检测和姿态估计

我们开发了一种无框自底向上的方法，用于人检测和姿态估计。

它由两个连续的步骤组成，检测

个

关键点，然后将它们分组为人

物实例。我们以监督的方式训练我们的网络，使用COCO数据集中

= 17个面部和身体部位的地面实况注释

关键点检测此阶段的目标是以实例不可知的方式检测属于图像中任何

人的所有可见关键点。

为此，我们遵循[33]的混合分类和回归方法，使其适应我们的多人

设置。我们生成热图（每个关键点一个通道）和偏移（每个关键点两

个通道，用于水平和垂直方向上的位移设

为图像中的2-D位置，其中

= 1

，

. . . N

是图像中的位置的索引，

是像素的数量。设

（

）

{

：

−

≤

}

是以

为中心的半径为

的圆盘。此外

，

是

j的k个顶点

的

顶点，其中

= 1

，

. . .

，

，其中

是图像中的人实例的数

量。

对于每个关键点类型

= l

，

. . .

，

，我们将二元分类任务设置

为

如下

。

我们

在

（

）

∈

（

，

）处

对任意的人实例

进行p k

（x）的预处理，否则

（

）= 0.因此，我们有

个独立的密集二进

制分类任务，每个关键点类型一个。每个都相当于预测图像中任何人

的特定关键点类型周围的半径为

的圆盘。对于本文中报道的所有实

验，盘半径值被设置为

= 32像素，并且与人实例尺度无关。我们特

意选择了一个不随实例大小缩放的磁盘半径，以便在分类损失中平等

地权衡所有人实例。在训练期间，我们将热图损失计算为沿图像

剩余17页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

PersonLab：自底向上的人体姿态估测与实例分割新法

Python-人体姿态估计和实例分割模型PersonLab的一个Kerastensorflow实现

SWAHR-HumanPose:自下而上的人体姿势估计

openpifpaf：在PyTorch中“ PifPaf：用于人体姿势估计的复合字段”的正式实现

Factor on Demand：因子模型的正确实施：自下而上的估计，自上而下的归因-matlab开发

mmpose:OpenMMLab姿势估计工具箱和基准

基于代理的模型：自下而上了解经济-研究论文

bottom-up-attention.pytorch:自下而上的注意力模型的PyTorch重新实现

DEKR:这是我们CVPR 2021论文“通过解开的关键点回归进行的自下而上的人体姿势估计”的正式实施（https

U（1）X模型中的中微子混合和R K异常：自下而上的方法

20210401-银河证券-军工行业动态报告：自下而上，优选估值和成长匹配的个股.pdf

最新资源