RGB-D视频动态规划连续动作识别算法

需积分: 31 2 下载量 25 浏览量 更新于2024-09-06 收藏 408KB PDF 举报
本文主要探讨的是RGB-D视频(结合了红绿蓝(RGB)图像和深度(D)信息的视频)中的连续动作识别技术。作者白栋天、张磊和黄华来自北京理工大学计算机学院,他们针对这一领域提出了一个创新的方法。这种方法的关键步骤如下: 1. 姿态表示:首先,从RGB-D视频中提取深度信息,通过对人体进行三维重建,将人体的姿态转化为规范化(即标准化)的骨架表示。这种转换有助于消除个体差异和环境变化对动作识别的影响。 2. 动作建模:接着,利用隐式马尔可夫模型(Hidden Markov Model, HMM)来对每个动作进行建模。HMM是一种统计建模工具,特别适合处理序列数据,能够捕捉动作之间的时序关系。 3. 序列划分:结合先验知识,对整个连续动作序列进行分段或划分,这有助于简化问题并提高识别的准确性。先验知识可能包括动作的起始和结束模式,或者动作间的逻辑顺序。 4. 构建代价函数:通过HMM的概率输出构建一个成本函数,这个函数衡量了不同动作序列的可能性。在动态规划(Dynamic Programming)框架下,这个函数被用来找到最优化的动作识别路径。 5. 算法求解:最后,运用动态规划算法求解代价函数的最小值,得出最优的动作识别标签,从而实现对连续动作的有效识别。 实验部分展示了这种方法在连续动作识别任务上的效率和准确性,这表明该算法不仅能在处理RGB-D视频时有效提取和理解动作信息,而且在实际应用中具有良好的性能表现。这项研究对于视频监控、人机交互、运动分析等领域有着重要的理论和实践价值。中图分类号 TP399 指定该论文属于计算机科学技术类别,文献标志码 A 表示文章质量得到了认可。