深度图像动作识别:稀疏编码局部时空描述子方法

需积分: 2 0 下载量 70 浏览量 更新于2024-09-11 收藏 759KB PDF 举报
"本文主要探讨了一种新的基于稀疏编码局部时空描述子的动作识别方法,旨在解决现有算法训练速度慢和识别精度不高的问题。该方法利用深度图像,结合法线提取和自适应时空金字塔,形成显著性局部时空描述子,并通过稀疏编码和简化粒子群优化的支持向量机(SVM)提高识别效率和准确性。实验结果显示,这种方法在MSRAction3D和MSRGesture3D数据集上的识别率分别达到93.80%和95.83%,表明其有效性和鲁棒性。" 正文: 人体动作识别是计算机视觉领域的关键研究方向,其应用广泛,如人机交互、虚拟现实和视频监控。随着Kinect等低成本深度感知设备的普及,基于深度图像的动作识别成为了研究热点。与传统的视频分析相比,深度图像不受环境光线和纹理影响,能提供稳定的人体骨架信息,对噪声和遮挡具有更好的抵抗力。 本文提出的方法首先从深度图像中提取法线,以理解动作的表面变化。接着,采用基于运动能量的自适应时空金字塔将动作帧划分为多个块,这有助于捕捉动作的时空连续性。然后,通过局部聚集法线,形成局部时空描述子,这些描述子能够反映动作的动态特征。接下来,运用稀疏编码技术,将局部时空描述子转化为一组字典向量,用于重构样本数据,这种编码方式可以减少冗余信息,增强特征的区分度。 为了进一步提高识别效果,文章引入了简化粒子群优化(sPSO)算法来调整支持向量机(SVM)分类器。SVM是一种强大的分类工具,而sPSO用于优化SVM的参数,寻找最佳分类超平面,以提高分类精度和训练效率。实验在两个公开数据集MSRAction3D和MSRGesture3D上验证了新方法,识别率分别达到93.80%和95.83%,与传统方法相比,训练速度有显著提升。 基于稀疏编码的局部时空描述子和sPSO优化的SVM为动作识别提供了一种有效的新途径。这种方法在保持高识别率的同时,提升了训练效率,对于实际应用具有重要意义。未来的研究可能聚焦于进一步提高识别的鲁棒性,适应更复杂多变的环境和动作,以及如何将此技术应用于大规模的实际系统。