深度学习驱动的视频敏感信息高效检索

深度学习

视频检索

99 浏览量更新于2024-08-26 收藏 1.76MB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

"基于深度学习的视频敏感信息检索的研究" 在当今大数据时代，视频图像数据的快速增长带来了管理和检索的挑战。为了有效地从海量视频中检索出敏感信息，本文提出了一种结合镜头边界检测和深度学习分类的解决方案。首先，文章介绍了视频关键帧提取的重要性，关键帧能够代表视频的主要内容，从而简化视频的检索过程。在视频关键帧提取部分，算法通过镜头边界检测确定关键帧。对于每个镜头，选择其中间帧作为关键帧候选，随后利用K-Means聚类方法对这些候选帧进行聚类。通过评估不同聚类数量的有效性，最终选择最优聚类数，并将每一类的聚类中心帧作为视频的关键帧。这种策略有助于减少冗余信息，保留视频的代表性内容。接着，文章引入了基于深度学习的分类模型，特别是使用了VGG16卷积神经网络架构。VGG16由多层卷积和全连接层组成，每层包含多个神经元，每个神经元通过点积运算处理输入特征，经过非线性转换后进行分类预测。这种深度学习模型能够学习到高级抽象特征，提高对敏感信息的识别准确性。在实际实现中，视频特征提取是关键步骤。考虑到视频的多样性和复杂性，文章采用了通用性特征，而非特定领域的特征。这使得算法具有更广泛的适应性，可以处理不同类型的视频数据。通过实验对比，文章评估了不同深度学习模型的性能，以确定最适合敏感信息检索的模型。这种方法的创新之处在于将传统的视频处理技术（如镜头边界检测和关键帧提取）与现代深度学习技术相结合，实现了对视频敏感信息的高效、准确检索。总结而言，这篇研究提出了一个综合的视频敏感信息检索框架，该框架结合了镜头边界检测的关键帧提取算法和深度学习分类模型，旨在应对大数据背景下视频信息检索的挑战。这一工作对于提升视频分析效率、保护用户隐私以及监控安全等领域具有重要意义。

资源详情

资源推荐

电子设计工程

Electronic Design Engineering

第 25卷

Vol.25

第 21期

No.21

2017年 11月

Nov. 2017

收稿日期：2016-08-31 稿件编号：201608236

作者简介：李想（1991—），男，湖北武汉人，硕士。研究方向：通信与信息系统。

随着互联网技术的快速发展，数据量呈指数式

的增长，伴随着移动互联网的浪潮，我们真正进入了

大数据时代。于此同时，视频作为网络数据的重要

组成部分，其数目也在飞速增长，如何管理这些视频

信息，已成为很棘手的问题。视频检索技术的出现

使得我们能提取视频关键信息，而深度学习的出现

使得我们能对视频中敏感信息进行高效准确的分

类，从而能得到敏感信息。

1 总体设计

本文设计分为两部分，第一部分为视频关键帧

提取部分，设计一种算法从一段视频中提取一段关

键帧序列，用来代表整段视频的主要内容。该算法

对整段视频进行镜头边界检测，对于任何一个镜头，

我们将第 n/2 作为其关键帧，然后生成一个视频关键

帧候选的序列，对该段序列进行 K-Means 聚类，通过

聚类的有效性分析方法选取最佳的聚类数量。最后对

于每一类选取聚类中心的帧作为视频的关键帧

[1-4]

。

第二部分是基于深度学习的分类模型，该模型

用于将得到的关键帧进行分类，检索我们需要的信

息。本文设计了一种基于深度学习的网络模型

VGG16，它是一种卷积神经网络。由一系列的偏置

项和权重项的神经元组成，每个神经元都接受若干

输入，并进行点积计算。将结果进行非线性处理，最

后通过分数函数进行预测。整体设计流程图如图 1

所示。

图 1 总体设计流程图

2 视频关键帧提取部分的实现

本文设计的关键帧提取算法分为 3 部分：视频

特征的提取、视频边界检测、关键帧序列的聚类。

2.1 视频特征提取

特征，即对应某一对象某些可量化的属性。对

于视频来说，主要分为通用性特征和针对特定领域

的特征

[5-6]

。针对视频的多样性，本文考虑的是通用

基于深度学习的视频敏感信息检索的研究

李想

（武汉邮电科学研究院湖北武汉 430000）

摘要：针对视频图像大数据的快速增长，如何从视频中快速检索出敏感信息急待解决。本文提出

了一种基于镜头边界的相似系数关键帧提取算法以获取视频关键帧，并设计基于深度学习的分类

模型进行分类。最后通过实验对比选取最好的分类模型。

关键词：深度学习；视频检索；关键帧

中图分类号：TN919.82 文献标识码：A 文章编号：1674-6236（2017）21-0137-04

Research on video sensitive information retrieval based on deep learning

LI Xiang

（Wuhan Research Institute of Posts and Telecommunications，Wuhan 430000，China）

Abstract: For the rapid growth of large data video images，how to quickly retrieve the sensitive informa⁃

tion from the video to be resolved. In this paper，a key frame algorithm based on shot boundary similarity

coefficient is proposed to obtain the key frame of the video，and the classification model based on the

deep learning is used to classify the video key frames. Finally，the best classification model is selected

through experiments.

Key words: deep learning；video retrieval；key frame

-- 137

下载后可阅读完整内容，剩余3页未读，立即下载

weixin_38649657

粉丝: 1
资源: 933

深度学习驱动的视频敏感信息高效检索

基于深度学习的视频敏感信息检索的研究.pdf

基于深度学习哈希算法的快速图像检索研究.pdf

论文研究-基于深度学习的哼唱检索算法研究 .pdf

基于深度学习下的图像检索技术概述

基于深度学习的图像检索优势

基于深度学习的图像检索

基于深度学习的图像检索代码

基于深度学习的计算机视觉中图像检索算法

检索课题关于动物有哪些

使用深度学习进行文档检索的论文

基于Transformer的视频检索

基于深度学习的以图搜图功能对深度学习的特征提取能力要求有多高

深度学习图像检索(cbir): 十年之大综述

基于深度学习的镜头运动分类算法应用场景

基于神经网络的图像检索方法的研究现状??csdn

基于地质图语义检索系统研究

目前主流的视频结构化算法是什么，使用的技术原理和底层架构是什么，基于什么来进行研究设计的

视频检索Transformer国内外发展

基于深度学习的手写汉字识别

请详细描述基于深度学习的特征提取方法如何实现

最新资源