有序光流图与双流CNN:提升行为识别精度的关键策略

6 下载量 87 浏览量 更新于2024-08-28 收藏 3.76MB PDF 举报
本文主要探讨了一种结合有序光流图和双流卷积神经网络的行为识别方法,旨在提高行为视频分析的准确性和效率。在面对行为视频中长时段的信息处理需求时,该算法显得尤为重要。以下是文章的核心知识点: 1. 有序光流图构建:首先,通过Rank支持向量机(SVM)算法对连续的光流序列进行处理,将其转化为单幅有序光流图。这种转换使得复杂的时空信息被压缩并结构化,便于后续模型对视频的长时段时域结构进行建模。 2. 双流卷积网络设计:接着,作者设计了一种双流卷积神经网络,它包含表观流和运动流两个分支。表观流部分利用堆叠的RGB帧来提取视频的空间信息,而运动流则分别使用有序光流图捕捉视频的短期和长期运动模式。这种设计允许模型同时关注空间特征和时间变化,增强了对行为识别的全面理解。 3. 特征提取与融合:网络的C3D描述子和VGG描述子分别负责提取表观和运动信息,然后将这两类特征进行融合。这种融合策略有助于整合不同层次和尺度的信息,提高了识别性能。 4. 行为识别:最后,融合后的特征被输入到线性SVM进行行为分类。SVM作为强大的非线性分类器,能够有效地利用这些多维度特征进行行为决策。 5. 实验验证:在HMDB51和UCF101两个常用的行为识别数据集上,实验结果显示,该算法显著提升了行为视频识别的准确性,证明了其在有效利用空间表观信息和时间运动信息方面的有效性。 本文的贡献在于提出了一种新颖的行为识别方法,它巧妙地利用有序光流图和双流卷积网络相结合的优势,有效地处理行为视频中的时空信息,从而提高了识别精度。这在机器视觉领域,特别是行为识别任务中具有重要的实际应用价值。