深度视频序列动作识别:基于MEM-LBP的方法
需积分: 20 119 浏览量
更新于2024-09-08
收藏 882KB PDF 举报
"该论文提出了一种基于MEM-LBP的动作特征提取及识别方法,用于解决人体动作识别中如何有效利用三维信息的挑战。通过深度视频序列,运用运动能量模型(MEM)来表征人体动态特性,结合局部二值模式(LBP)描述符编码运动能量模型,进一步提取和识别人体动作。实验在MSR Action3D和MSR Gesture3D数据库上进行,显示了方法的高识别效果。"
本文主要讨论的是人体动作识别技术,特别是如何从深度视频序列中提取并识别三维人体动作的特征。传统的二维图像处理方法在处理三维人体运动时存在局限性,因此,研究者们转向了深度视频序列,它能提供更丰富的空间和时间信息。
文中提出的方法首先采用运动能量模型(Motion Energy Model, MEM)来捕获人体动态特征。MEM是通过将深度视频序列投影到三个正交的笛卡尔平面上,然后将每个投影面的视频序列分割成能量相等的子时间序列,计算子序列的深度运动图能量。这种处理方式有助于捕捉到不同方向上的运动信息,增强了对动作变化的敏感度。
接下来,为了提取更丰富的特征,研究者应用了局部二值模式(Local Binary Pattern, LBP)。LBP是一种纹理描述符,能够有效地描述图像或视频序列中的局部结构和变化。在这里,LBP被用来编码运动能量模型,提取出人体运动的关键信息,如关节运动轨迹和速度变化等。
最后,论文采用了l2范数协同表示分类器进行动作分类识别。这种分类器考虑了特征之间的相关性,通过l2范数规范化,可以降低过拟合风险,提高分类性能。
在MSR Action3D和MSR Gesture3D这两个标准的三维动作识别数据库上,该方法的实验结果显示了其在动作识别方面的优越性。这些数据库包含了多样化的动作类别,是评估动作识别算法性能的重要基准。
这篇论文提出了一种创新的基于MEM-LBP的动作识别框架,该框架有效地融合了深度视频序列的三维信息和局部纹理特征,提高了动作识别的准确性和鲁棒性。这一工作对于理解复杂的人体运动、改进智能监控系统以及发展人机交互技术等领域具有重要意义。
916 浏览量
173 浏览量
245 浏览量
209 浏览量
2024-12-11 上传
187 浏览量
171 浏览量
231 浏览量
111 浏览量
weixin_39840914
- 粉丝: 436
- 资源: 1万+