语义引导神经网络在骨骼人体动作识别中的创新应用

1 下载量 141 浏览量 更新于2025-01-16 收藏 682KB PDF 举报
"本文介绍了语义引导神经网络(SGN)在基于骨架的人体动作识别中的应用,强调了骨架数据在动作识别中的重要性,并提出了一种新的网络架构,该架构利用关节的高级语义信息增强特征表示能力。SGN包含关节级模块和帧级模块,分别用于处理关节间的相关性和帧间的依赖性。该模型在NTU60、NTU120和SYSU数据集上取得了最先进的性能,同时模型尺寸显著小于大多数大型工程。" 在基于骨架的人体动作识别中,由于骨架数据的易获取和结构化特性,它已经成为一种有效的输入方式。传统的做法常使用深层前馈神经网络来处理关节的三维坐标,但这种做法可能忽视了计算效率。SGN的提出是为了克服这个问题,它不仅考虑了关节的三维坐标,还引入了关节的高级语义信息,如关节类型和帧索引,这些信息有助于网络更好地理解动作的动态过程。 SGN的核心在于其设计的两个模块。关节级模块关注于同一帧内不同关节之间的相关性建模,这对于捕捉局部运动模式至关重要。帧级模块则着眼于整个帧的依赖性,通过将同一帧内的所有关节视为一个整体来捕捉动作的时间连续性,这有助于理解和识别跨时间的动作序列。 在设计上,SGN的模型尺寸显著减小,这意味着它在保持高识别性能的同时,也具备更高的计算效率和内存利用率。这为实际应用提供了可能性,尤其是在资源有限的设备上。图1展示了SGN在NTU60数据集上的精度与参数数量的比较,显示了SGN在模型大小和性能之间的优秀平衡。 实验结果显示,SGN在NTU60、NTU120和SYSU等标准数据集上都达到了最先进的识别性能。这表明,即使模型规模更小,SGN也能有效地捕获复杂的动作模式。这一成就对于推动人体动作识别领域的发展,特别是对于构建更加高效和准确的模型,有着重要的意义。 总结来说,"语义引导神经网络在基于骨架的人体动作识别中的应用"这一研究提出了一种新颖的神经网络架构,通过结合关节的高级语义信息和模块化的建模策略,实现了在保证识别性能的同时,大幅度降低了模型复杂度。这对于未来的研究者来说,提供了一个强有力的基线,可以进一步探索如何在骨骼数据基础上优化动作识别算法,以及如何在资源受限的环境中实现高效的动作识别系统。