有序光流图与双流CNN:提升行为识别精度的关键策略
87 浏览量
更新于2024-08-28
收藏 3.76MB PDF 举报
本文主要探讨了一种结合有序光流图和双流卷积神经网络的行为识别方法,旨在提高行为视频分析的准确性和效率。在面对行为视频中长时段的信息处理需求时,该算法显得尤为重要。以下是文章的核心知识点:
1. 有序光流图构建:首先,通过Rank支持向量机(SVM)算法对连续的光流序列进行处理,将其转化为单幅有序光流图。这种转换使得复杂的时空信息被压缩并结构化,便于后续模型对视频的长时段时域结构进行建模。
2. 双流卷积网络设计:接着,作者设计了一种双流卷积神经网络,它包含表观流和运动流两个分支。表观流部分利用堆叠的RGB帧来提取视频的空间信息,而运动流则分别使用有序光流图捕捉视频的短期和长期运动模式。这种设计允许模型同时关注空间特征和时间变化,增强了对行为识别的全面理解。
3. 特征提取与融合:网络的C3D描述子和VGG描述子分别负责提取表观和运动信息,然后将这两类特征进行融合。这种融合策略有助于整合不同层次和尺度的信息,提高了识别性能。
4. 行为识别:最后,融合后的特征被输入到线性SVM进行行为分类。SVM作为强大的非线性分类器,能够有效地利用这些多维度特征进行行为决策。
5. 实验验证:在HMDB51和UCF101两个常用的行为识别数据集上,实验结果显示,该算法显著提升了行为视频识别的准确性,证明了其在有效利用空间表观信息和时间运动信息方面的有效性。
本文的贡献在于提出了一种新颖的行为识别方法,它巧妙地利用有序光流图和双流卷积网络相结合的优势,有效地处理行为视频中的时空信息,从而提高了识别精度。这在机器视觉领域,特别是行为识别任务中具有重要的实际应用价值。
2021-05-26 上传
2019-10-03 上传
点击了解资源详情
2021-09-25 上传
2021-09-26 上传
2021-09-25 上传
2021-09-26 上传
2021-09-26 上传
weixin_38641111
- 粉丝: 1
- 资源: 931
最新资源
- C语言数组操作:高度检查器编程实践
- 基于Swift开发的嘉定单车LBS iOS应用项目解析
- 钗头凤声乐表演的二度创作分析报告
- 分布式数据库特训营全套教程资料
- JavaScript开发者Robert Bindar的博客平台
- MATLAB投影寻踪代码教程及文件解压缩指南
- HTML5拖放实现的RPSLS游戏教程
- HT://Dig引擎接口,Ampoliros开源模块应用
- 全面探测服务器性能与PHP环境的iprober PHP探针v0.024
- 新版提醒应用v2:基于MongoDB的数据存储
- 《我的世界》东方大陆1.12.2材质包深度体验
- Hypercore Promisifier: JavaScript中的回调转换为Promise包装器
- 探索开源项目Artifice:Slyme脚本与技巧游戏
- Matlab机器人学习代码解析与笔记分享
- 查尔默斯大学计算物理作业HP2解析
- GitHub问题管理新工具:GIRA-crx插件介绍