时空信息驱动的时序动态图双流网络人体行为识别
13 浏览量
更新于2024-08-27
收藏 3.11MB PDF 举报
本文主要探讨了结合时序动态图和双流卷积网络的人体行为识别方法。在当前的计算机视觉领域,对长时间和空间信息的精确捕捉对于理解复杂的人体动作至关重要。作者针对这一问题,提出了一种创新的算法设计。
首先,文章引入了双向顺序池化算法,用于构建时序动态图。这是一种将三维的视频数据转化为二维结构的技术,通过这种方式,能够捕捉到动作的外观特征(表观信息)以及长时的时空动态变化,这对于识别动作的连贯性和模式至关重要。
接下来,作者提出了一种基于InceptionV3架构的双流卷积网络。这种网络结构包括两个子流:表观流和运动流。表观流处理时序动态图,捕捉动作的整体外观信息;而运动流则处理堆叠的光流帧序列,关注动作的局部运动细节,尤其是短时动态。通过数据增强技术,如旋转、缩放和亮度调整,增强了模型对不同环境和视角下的行为识别能力。此外,模态预训练使得模型在初始阶段就能从大量数据中学习通用特征,而稀疏采样则有助于减少计算量,提高效率。
最后,两种流的输出类别判定分数通过平均池化进行融合,综合考虑了时空维度的信息,提高了整体识别精度。实验结果在UCF101和HMDB51这两个广泛使用的动作识别数据集中得到了验证,相较于传统的双流卷积网络,该方法显著提升了识别率,并展示了良好的鲁棒性和有效性。
总结来说,本文的核心贡献在于设计了一种新颖的人体行为识别框架,它巧妙地结合了时序动态图和双流卷积网络的优势,有效地捕捉了动作的时空特性,从而提高了识别性能。这种方法在实际应用中具有广阔前景,尤其是在监控、体育分析和虚拟现实等领域。
2019-08-13 上传
2021-09-25 上传
点击了解资源详情
2023-09-05 上传
2021-09-25 上传
2022-07-13 上传
2021-09-25 上传
weixin_38562130
- 粉丝: 10
- 资源: 978
最新资源
- 黑板风格计算机毕业答辩PPT模板下载
- CodeSandbox实现ListView快速创建指南
- Node.js脚本实现WXR文件到Postgres数据库帖子导入
- 清新简约创意三角毕业论文答辩PPT模板
- DISCORD-JS-CRUD:提升 Discord 机器人开发体验
- Node.js v4.3.2版本Linux ARM64平台运行时环境发布
- SQLight:C++11编写的轻量级MySQL客户端
- 计算机专业毕业论文答辩PPT模板
- Wireshark网络抓包工具的使用与数据包解析
- Wild Match Map: JavaScript中实现通配符映射与事件绑定
- 毕业答辩利器:蝶恋花毕业设计PPT模板
- Node.js深度解析:高性能Web服务器与实时应用构建
- 掌握深度图技术:游戏开发中的绚丽应用案例
- Dart语言的HTTP扩展包功能详解
- MoonMaker: 投资组合加固神器,助力$GME投资者登月
- 计算机毕业设计答辩PPT模板下载