多视角深度图后处理提升人体姿势估计精度

需积分: 5 0 下载量 127 浏览量 更新于2024-08-08 1 收藏 982KB PDF 举报
"姿势估计算法里用多视角深度图的后处理 (2014年)" 本文探讨了人体姿势估计算法中的一个重要问题,即部分节点的精度不足,并提出了一种结合多视角深度图的后处理技术来优化这一问题。在传统的姿势估计算法中,由于训练数据量大、计算复杂度高,可能会导致某些骨架节点的预测精度不高。为了解决这个问题,该论文提出了以下策略: 1. 训练集优化:首先,通过精心选择和构建一个规模较小但包含常见典型动作的训练集合。这种方法旨在减少训练所需的数据量,同时保持足够的多样性,以便模型能够学习到关键的运动模式。 2. 利用小型集群服务器训练:使用小型集群服务器进行模型训练,这既节省了计算资源,又能保证模型的训练效率。 3. 后处理技术:对于那些预测置信度不高的骨架节点,论文提出了一种新的后处理方法。该方法利用深度图投影生成侧视图和顶视图,然后在这些不同视角下重新计算需要修正的节点。这种多视角的处理方式有助于提高节点定位的准确性,因为它提供了更多角度的信息来辅助判断。 4. 实验结果:实验结果显示,采用该方法后,即使在使用较少数量级的样本情况下,相比于微软原有的算法,平均误差可以显著降低,达到9毫米的改进。这表明提出的后处理技术能够在减少训练成本的同时,提升姿势估计的精度。 此外,本文由程光、王贵锦和林行刚三位作者完成,他们分别来自清华大学电子工程系,专注于图像处理、人机交互和视频分析等领域的研究。文章被国家自然科学基金资助,属于工程技术类论文,其关键词包括人体姿势估计、人体骨架节点、后处理、侧视图和顶视图。文献标识码和文章编号也给出了相应的学术信息。 本文介绍了一种有效的人体姿势估计算法优化策略,通过多视角深度图的后处理技术,提高了算法在有限数据条件下的性能,这对于实际应用中的姿态识别和追踪具有重要的实用价值。