3D人体动作识别:多速度STIPs在手部与手势识别中的应用

需积分: 10 1 下载量 27 浏览量 更新于2024-09-09 收藏 233KB PDF 举报
"基于多速度STIP的人类行为识别" 本文主要探讨了在3D数字捕捉设备迅速发展的背景下,如何利用先进的计算机视觉技术进行精确的人类行为识别,特别是对手部动作和手势的识别。随着大数据时代的到来,信息处理的需求日益增长,传统的行为分析方法已无法满足对精细动作识别的要求。作者提出了一种3D人类活动识别的完整框架,旨在提升手部和手势行为分析的准确性。 首先,文章介绍了改进的图割方法用于手部分割和跟踪。图割法是一种优化算法,常用于图像分割,通过最小化能量函数来确定像素的类别。在此基础上,对图割算法进行了优化,使其能更准确地分离出手部区域并追踪其运动轨迹。 接着,为了更好地表征人类活动的区分性特征,作者提出了3D Mesh MoSIFT特征描述符。Mesh MoSIFT(Mesh Motion SIFT)是结合了3D几何特性和人类行为先验信息的特征提取方法。SIFT(尺度不变特征变换)是经典的图像特征检测和描述算法,具有旋转、尺度和亮度不变性。通过将SIFT与3D网格(Mesh)相结合,并考虑动作的动态信息,这种特征描述符能有效地捕获手部和手势的运动模式和形状变化。 然后,文章采用模拟正交匹配追逐(Simulation Orthogonal Matching Pursuit, SOMP)编码视觉词典。正交匹配追逐是稀疏编码的一种算法,用于从大量基中找出一个较小的子集,这些基可以有效地表示输入信号。在行为识别中,SOMP可以用于从高维特征空间中提取最具代表性的特征向量,从而降低计算复杂度,提高识别效率。 实验部分,作者使用了一个RGB-D视频数据集和ChaLearn手势数据集进行了验证。这两个数据集提供了丰富的3D信息,包括彩色图像和深度信息,适合于3D行为识别的研究。实验结果表明,提出的3D人类活动识别框架相比于传统方法显著提高了识别精度,验证了其在大数据环境下的有效性和实用性。 关键词:大数据;3D数字捕捉;手部行为识别;3D Mesh MoSIFT;模拟正交匹配追逐