深度图像动作识别:稀疏编码局部时空描述子方法
需积分: 2 70 浏览量
更新于2024-09-11
收藏 759KB PDF 举报
"本文主要探讨了一种新的基于稀疏编码局部时空描述子的动作识别方法,旨在解决现有算法训练速度慢和识别精度不高的问题。该方法利用深度图像,结合法线提取和自适应时空金字塔,形成显著性局部时空描述子,并通过稀疏编码和简化粒子群优化的支持向量机(SVM)提高识别效率和准确性。实验结果显示,这种方法在MSRAction3D和MSRGesture3D数据集上的识别率分别达到93.80%和95.83%,表明其有效性和鲁棒性。"
正文:
人体动作识别是计算机视觉领域的关键研究方向,其应用广泛,如人机交互、虚拟现实和视频监控。随着Kinect等低成本深度感知设备的普及,基于深度图像的动作识别成为了研究热点。与传统的视频分析相比,深度图像不受环境光线和纹理影响,能提供稳定的人体骨架信息,对噪声和遮挡具有更好的抵抗力。
本文提出的方法首先从深度图像中提取法线,以理解动作的表面变化。接着,采用基于运动能量的自适应时空金字塔将动作帧划分为多个块,这有助于捕捉动作的时空连续性。然后,通过局部聚集法线,形成局部时空描述子,这些描述子能够反映动作的动态特征。接下来,运用稀疏编码技术,将局部时空描述子转化为一组字典向量,用于重构样本数据,这种编码方式可以减少冗余信息,增强特征的区分度。
为了进一步提高识别效果,文章引入了简化粒子群优化(sPSO)算法来调整支持向量机(SVM)分类器。SVM是一种强大的分类工具,而sPSO用于优化SVM的参数,寻找最佳分类超平面,以提高分类精度和训练效率。实验在两个公开数据集MSRAction3D和MSRGesture3D上验证了新方法,识别率分别达到93.80%和95.83%,与传统方法相比,训练速度有显著提升。
基于稀疏编码的局部时空描述子和sPSO优化的SVM为动作识别提供了一种有效的新途径。这种方法在保持高识别率的同时,提升了训练效率,对于实际应用具有重要意义。未来的研究可能聚焦于进一步提高识别的鲁棒性,适应更复杂多变的环境和动作,以及如何将此技术应用于大规模的实际系统。
2019-07-22 上传
2019-09-06 上传
2019-09-16 上传
2019-07-22 上传
2019-09-10 上传
weixin_38744153
- 粉丝: 347
- 资源: 2万+
最新资源
- Raspberry Pi OpenCL驱动程序安装与QEMU仿真指南
- Apache RocketMQ Go客户端:全面支持与消息处理功能
- WStage平台:无线传感器网络阶段数据交互技术
- 基于Java SpringBoot和微信小程序的ssm智能仓储系统开发
- CorrectMe项目:自动更正与建议API的开发与应用
- IdeaBiz请求处理程序JAVA:自动化API调用与令牌管理
- 墨西哥面包店研讨会:介绍关键业绩指标(KPI)与评估标准
- 2014年Android音乐播放器源码学习分享
- CleverRecyclerView扩展库:滑动效果与特性增强
- 利用Python和SURF特征识别斑点猫图像
- Wurpr开源PHP MySQL包装器:安全易用且高效
- Scratch少儿编程:Kanon妹系闹钟音效素材包
- 食品分享社交应用的开发教程与功能介绍
- Cookies by lfj.io: 浏览数据智能管理与同步工具
- 掌握SSH框架与SpringMVC Hibernate集成教程
- C语言实现FFT算法及互相关性能优化指南