提升视频分类精度:时空深度特征两级编码融合策略
53 浏览量
更新于2024-08-28
1
收藏 781KB PDF 举报
本文主要探讨了"基于时空域深度特征两级编码融合的视频分类"这一主题。针对现有深度特征在视频分类任务中表现欠佳的问题,作者提出了一种创新的方法。这种方法首先通过两个深度卷积神经网络(Deep Convolutional Neural Networks, DCNN)模型分别从空间和时间两个维度对视频帧进行深度特征提取,空间深度信息反映了帧内像素间的结构关系,而时间深度信息则捕捉了视频序列中的动态变化。
接着,文章采用了Fisher向量和局部聚合两种技术进行特征编码。Fisher向量是一种有效的表示方法,它能将高维特征空间中的数据转换为低维、紧凑的特征表示,保留了原始数据的重要信息。局部聚合则是对邻域内的特征进行聚合,增强了特征的稳定性和鲁棒性。这种两级级联编码策略使得视频的表示更为高效且富有区分度。
在编码之后,时空域的联合深度特征被整合,成为分类的输入。支持向量机(Support Vector Machine, SVM)作为一种强大的机器学习算法,被用来进行视频类别识别。通过这种方法,视频的时空特性得以充分利用,提高了分类的准确性。
实验部分在UCF101数据集上进行了验证。对比其他现有方法,该算法展现出显著的分类精度提升,这表明了在视频分类任务中,时空域深度特征的两级编码融合策略确实能够有效地提高性能。
这篇文章的核心贡献在于提出了一种结合深度学习、时空特征提取和多级编码融合的视频分类框架,优化了特征表示和分类过程,从而在实际应用中取得了优于传统方法的结果。这对于视频分析、计算机视觉等领域具有重要的理论和实践价值。
2021-09-25 上传
点击了解资源详情
点击了解资源详情
点击了解资源详情
点击了解资源详情
2024-11-15 上传
2024-11-15 上传
weixin_38706782
- 粉丝: 2
- 资源: 929
最新资源
- 平尾装配工作平台运输支撑系统设计与应用
- MAX-MIN Ant System:用MATLAB解决旅行商问题
- Flutter状态管理新秀:sealed_flutter_bloc包整合seal_unions
- Pong²开源游戏:双人对战图形化的经典竞技体验
- jQuery spriteAnimator插件:创建精灵动画的利器
- 广播媒体对象传输方法与设备的技术分析
- MATLAB HDF5数据提取工具:深层结构化数据处理
- 适用于arm64的Valgrind交叉编译包发布
- 基于canvas和Java后端的小程序“飞翔的小鸟”完整示例
- 全面升级STM32F7 Discovery LCD BSP驱动程序
- React Router v4 入门教程与示例代码解析
- 下载OpenCV各版本安装包,全面覆盖2.4至4.5
- 手写笔画分割技术的新突破:智能分割方法与装置
- 基于Koplowitz & Bruckstein算法的MATLAB周长估计方法
- Modbus4j-3.0.3版本免费下载指南
- PoqetPresenter:Sharp Zaurus上的开源OpenOffice演示查看器