电子设计工程
Electronic Design Engineering
第 25卷
Vol.25
第 21期
No.21
2017年 11月
Nov. 2017
收稿日期:2016-08-31 稿件编号:201608236
作者简介:李 想(1991—),男,湖北武汉人,硕士。研究方向:通信与信息系统。
随着互联网技术的快速发展,数据量呈指数式
的增长,伴随着移动互联网的浪潮,我们真正进入了
大数据时代。于此同时,视频作为网络数据的重要
组成部分,其数目也在飞速增长,如何管理这些视频
信息,已成为很棘手的问题。视频检索技术的出现
使得我们能提取视频关键信息,而深度学习的出现
使得 我们能 对视 频中敏 感信 息进 行高效 准确 的分
类,从而能得到敏感信息。
1 总体设计
本文设计分为两部分,第一部分为视频关键帧
提取部分,设计一种算法从一段视频中提取一段关
键帧序列,用来代表整段视频的主要内容。该算法
对整段视频进行镜头边界检测,对于任何一个镜头,
我们将第 n/2 作为其关键帧,然后生成一个视频关键
帧候选的序列,对该段序列进行 K-Means 聚类,通过
聚类的有效性分析方法选取最佳的聚类数量。最后对
于每一类选取聚类中心的帧作为视频的关键帧
[1-4]
。
第二部分是基于深度学习的分类模型,该模型
用于将得到的关键帧进行分类,检索我们需要的信
息 。 本 文 设 计 了 一 种 基 于 深 度 学 习 的 网 络 模 型
VGG16,它是一种卷积神经网络。由一系列的偏置
项和权重项的神经元组成,每个神经元都接受若干
输入,并进行点积计算。将结果进行非线性处理,最
后通过分数函数进行预测。整体设计流程图如图 1
所示。
图 1 总体设计流程图
2 视频关键帧提取部分的实现
本文设计的关键帧提取算法分为 3 部 分:视 频
特征的提取、视频边界检测、关键帧序列的聚类。
2.1 视频特征提取
特征,即对应某一对象某些可量化的属性。对
于视频来说,主要分为通用性特征和针对特定领域
的特征
[5-6]
。针对视频的多样性,本文考虑的是通用
基于深度学习的视频敏感信息检索的研究
李 想
(武汉邮电科学研究院 湖北 武汉 430000)
摘要:针对视频图像大数据的快速增长,如何从视频中快速检索出敏感信息急待解决。本文提出
了一种基于镜头边界的相似系数关键帧提取算法以获取视频关键帧,并设计基于深度学习的分类
模型进行分类。最后通过实验对比选取最好的分类模型。
关键词:深度学习;视频检索;关键帧
中图分类号:TN919.82 文献标识码:A 文章编号:1674-6236(2017)21-0137-04
Research on video sensitive information retrieval based on deep learning
LI Xiang
(Wuhan Research Institute of Posts and Telecommunications,Wuhan 430000,China)
Abstract: For the rapid growth of large data video images,how to quickly retrieve the sensitive informa⁃
tion from the video to be resolved. In this paper,a key frame algorithm based on shot boundary similarity
coefficient is proposed to obtain the key frame of the video,and the classification model based on the
deep learning is used to classify the video key frames. Finally,the best classification model is selected
through experiments.
Key words: deep learning;video retrieval;key frame
-- 137