优化稀疏图回归:2019年动作识别中骨架的高效表达

需积分: 0 1 下载量 141 浏览量 更新于2024-08-05 收藏 1.01MB PDF 举报
2019年的研究论文《优化基于骨骼的行动识别通过稀疏化图回归》(Optimized Skeleton-based Action Recognition via Sparsified Graph Regression)由Xiang Gao、Wei Hu、Jiaxiang Tang、Jiaying Liu和Zongming Guo等人在清华大学计算机科学与技术学院提出。随着深度传感器的普及,动态人体骨骼作为动作识别的一种强大模态引起了广泛关注。传统的研究方法主要依赖于循环神经网络(RNN)或卷积神经网络(CNN),但它们在处理不规则骨骼关节时的表达能力有限。 然而,图卷积网络(GCN)被提出以应对不规则结构数据,但关键的图构建仍然是一个挑战。该论文创新性地将骨骼自然地表示为图,并提出了一种基于图回归的图卷积网络(GR-GCN),旨在捕捉数据中的空间-时间变化。作者认识到图表示对图卷积至关重要,因此首先提出了一种图回归方法,通过统计学习从多观察数据中挖掘潜在的图结构。这种方法特别关注空间-时间特征的学习,通过稀疏化策略来优化模型,减少冗余信息,提高模型的效率和准确性。 GR-GCN的设计考虑了骨骼之间的隐式关联,通过学习节点间的连接权重,有效地捕捉了动作序列中各关节之间的复杂关系。这种稀疏化的图构建允许模型更好地聚焦于动作的关键部分,避免了过拟合,提升了对各种动作的泛化能力。同时,通过将时间和空间维度整合到图卷积过程中,论文提出的方法能够更好地理解和解析动作序列中的动态变化。 这篇论文为骨骼动作识别提供了一个新颖且优化的框架,它不仅解决了图结构建模的问题,还展示了如何通过统计学习和稀疏化策略提升模型的性能。这一研究对于利用骨骼数据进行动作识别的实际应用具有重要意义,特别是在智能监控、运动分析和人机交互等领域。