多特征融合的RGB-D动作识别方法

5 下载量 23 浏览量 更新于2024-08-27 1 收藏 1.14MB PDF 举报
"基于多特征融合的动作识别方法" 本文是一篇研究论文,主要探讨了一种新的基于多特征融合的人体动作识别技术。该方法利用了RGB-D图像序列,结合深度特征和时空特征,通过随机森林学习框架进行有效的动作识别。作者石祥滨及其团队来自沈阳航空航天大学计算机学院和辽宁大学信息学院,他们的研究工作得到了多项基金的支持。 在方法的具体实现中,首先从深度图像序列中检测和获取人的关键关节位置,以此为基础提取出两种新的深度特征——位移特征和部件中心特征。位移特征描述了人体关节在时间序列中的运动轨迹,而部件中心特征则反映了人体各部位的三维结构信息。这两种特征共同作用,能够更全面地捕获人体动作的动态变化。 接着,研究人员从RGB图像序列中提取稠密轨迹,通过这一过程可以筛选出前景中的轨迹,减少背景的干扰。然后,他们采用词袋模型(Bag-of-Words, BoW)构建时空特征,这是一种常用的数据表示方法,能有效捕捉帧间的运动模式和动作的连续性。 最后,为了融合上述两种互补的特征,研究者应用了随机森林学习框架。随机森林是一种集成学习方法,具有鲁棒性和高效性,能够处理高维度数据,并有效地降低过拟合风险。通过训练随机森林模型,将深度特征和时空特征结合起来,提高了动作识别的准确性。 实验部分,作者在MSR DailyActivity3D数据集上验证了该方法的有效性,这个数据集包含多种日常活动,是评估RGB-D图像序列动作识别算法的常见基准。结果显示,所提出的多特征融合方法在动作识别任务中表现出色,证明了其在实际应用中的潜力。 总结起来,这篇论文的核心贡献在于提出了一种创新的多特征融合策略,将深度图像的结构信息和RGB图像的运动信息有效地结合起来,以提升人体动作识别的性能。这种方法对于视频监控、人机交互、虚拟现实等领域具有重要的理论和实践意义。