四元数时空CNN提升人体行为识别精度至85.34%
需积分: 50 196 浏览量
更新于2024-09-06
收藏 3.25MB PDF 举报
本文主要探讨了"基于四元数时空卷积神经网络的人体行为识别"这一领域的研究。传统卷积神经网络(CNN)在处理图像时通常针对灰度图像或彩色图像的单通道特征进行处理,这种做法忽略了颜色通道之间的空间依赖性,可能导致真实环境中的颜色信息丢失,从而影响人体行为识别的准确性。为解决这个问题,研究人员提出了一个创新的方法,即利用四元数时空卷积神经网络(QST CNN)。
QST CNN的主要步骤包括预处理阶段和网络结构设计。首先,他们采用了码本算法对样本集中的所有图像进行预处理,这一步骤旨在提取出图像中人体运动的关键区域,提高后续处理的效率和精度。然后,他们将彩色图像转换为四元数矩阵形式,这是QST CNN的独特之处,它允许将红、绿、蓝三个通道作为一个整体来考虑,这样可以更好地捕捉到动作空间特征,同时考虑了不同颜色通道间的相互作用。
在网络的结构上,他们扩展了标准CNN的空间卷积层,将其应用到四元数空间,实现了对颜色通道的整体卷积。此外,通过时间卷积层,网络能够捕获相邻帧的动态信息,增强了对行为变化的敏感性。这样,QST CNN不仅考虑了空间信息,还考虑了时间维度上的连续性,从而提高了识别性能。
为了验证新方法的有效性,文章对比了QST CNN与传统的灰度单通道CNN(Gray CNN)以及RGB 3通道CNN(3Channel CNN)在人体行为识别任务上的表现。实验结果显示,QST CNN在Weizmann和UCF sports数据集上分别达到了85.34%和80.2%的高识别率,这显著优于其他常用的识别方法。这表明,基于四元数时空卷积神经网络的人体行为识别方法在保持颜色信息完整性和捕捉行为动态方面具有显著优势,对于提高人体行为识别的准确性和鲁棒性具有重要的理论价值和实践意义。
2018-12-11 上传
2019-04-06 上传
2021-09-25 上传
2021-09-25 上传
2021-09-25 上传
2021-09-25 上传
2021-09-25 上传
2021-09-25 上传
weixin_38744153
- 粉丝: 347
- 资源: 2万+
最新资源
- Android圆角进度条控件的设计与应用
- mui框架实现带侧边栏的响应式布局
- Android仿知乎横线直线进度条实现教程
- SSM选课系统实现:Spring+SpringMVC+MyBatis源码剖析
- 使用JavaScript开发的流星待办事项应用
- Google Code Jam 2015竞赛回顾与Java编程实践
- Angular 2与NW.js集成:通过Webpack和Gulp构建环境详解
- OneDayTripPlanner:数字化城市旅游活动规划助手
- TinySTM 轻量级原子操作库的详细介绍与安装指南
- 模拟PHP序列化:JavaScript实现序列化与反序列化技术
- ***进销存系统全面功能介绍与开发指南
- 掌握Clojure命名空间的正确重新加载技巧
- 免费获取VMD模态分解Matlab源代码与案例数据
- BuglyEasyToUnity最新更新优化:简化Unity开发者接入流程
- Android学生俱乐部项目任务2解析与实践
- 掌握Elixir语言构建高效分布式网络爬虫