实时多人人体姿态识别:Part Affinity Fields解析

需积分: 49 40 下载量 71 浏览量 更新于2024-08-23 收藏 11.06MB PPT 举报
"得到的预测点有很多很多很多可能的连接-曹哲-实时多人人体姿态识别学习(自制PPT)" 本文将深入探讨实时多人人体姿态识别技术,特别是在使用Part Affinity Fields(PAFs)的方法中所涉及的关键概念和算法。曹哲的分享主要关注如何在复杂的视觉场景中,有效地解决预测点的连接问题,特别是处理高维匹配问题的挑战。 首先,介绍到的问题是当预测到的人体关键点众多时,如何确定这些点之间的正确连接,这是一个典型的K维匹配问题,被认为是NP-Hard问题。为了解决这个问题,曹哲提到了二分图与匈牙利算法的概念。二分图是一种特殊的图论结构,其顶点可以分为两个互不相交的集合,所有边都连接这两个集合内的顶点。无权二分图的最大匹配和完美匹配是寻找图中尽可能多的、不相交的边集合,使得每个顶点至少有一条边相连。而在有向二分图中,匈牙利算法则用于找到最大匹配,这对于解决人体关键点的连接问题至关重要。 实时多人人体姿态识别的目标是,给定一张RGB图像,不仅要定位所有人体关键点的位置,还要确定每个关键点所属的人体,即关键点间的连接信息。这种任务通常有两种方法:Top-down Approach和Bottom-up Approach。Top-down方法先进行人体检测,然后对每个人进行姿态估计,但依赖于人体检测的准确性,速度与图像中人物数量成正比。而Bottom-up方法先检测所有关键点,再进行点的关联,这种方法引入了Part Affinity Fields来解决连接问题。 Part Affinity Fields(PAFs)是一种创新的技术,它预测每个关键点之间的连接方向,以帮助确定哪些关键点应该连接在一起。在PAFs中,每个关键点都有一个对应的“亲和场”,这些场包含了连接信息,例如中点连接法,即预测每个关键点间中点的热度图,并用响应值作为连接的确信度。然而,这种方法的局限性在于仅考虑了肢体位置,忽略了旋转信息,并将肢体的支持范围简化为一个点。 曹哲的分享还提到了利用卷积神经网络(CNN)如Convolutional Pose Machines来预测关键点位置,并通过非极大值抑制(NMS)在测试时选择最有可能的关键点。同时,他提出了两分支多阶段结构图的模型,这种结构可以同时进行部分检测和部分关联,以提高识别效率和准确性。 总结来说,实时多人人体姿态识别是一个复杂的问题,涉及到计算机视觉、图论、机器学习等多个领域的知识。曹哲的分享强调了二分图匹配和PAFs在解决这一问题中的核心作用,为理解和优化这类系统提供了宝贵的见解。通过持续的研究和改进,这些技术有望在监控、游戏、健康监测等领域发挥更大的作用。