深度哈希图像表示：融合特征关联性的新方法

需积分: 10 8 浏览量更新于2024-08-13 收藏 999KB PDF 举报

"融合特征关联性的深度哈希图像表示方法" 本文针对深度学习中的图像表示问题，特别是深度描述子无法充分表达图像特征间关联性的不足，提出了一种创新的深度哈希图像表示方法。该方法旨在通过融合特征关联性来提升图像检索的效率和准确性。首先，文章介绍了一个预训练的神经网络模型，该模型用于生成图像的特征映射。这个映射能够捕捉到图像的多层次信息，为后续的深度特征描述子提取提供了基础。深度特征描述子是网络中特定层的激活向量，它们包含了丰富的图像特性，但通常忽略了特征之间的相互作用。接着，作者将这些深度特征描述子映射为深度视觉词。深度视觉词的概念借鉴了自然语言处理中的词汇概念，通过这种方式，可以将连续的深度特征离散化，便于进行后续的频繁项集发现。频繁项集分析是数据挖掘中的一个常用技术，用于找出数据集中频繁出现的组合模式。在图像表示中，这有助于识别和编码图像中的共现特征。随后，将离散的深度视觉词图像表示与基于哈希值的频繁项集图像表示相结合，生成一种新的图像表示形式。这种表示结合了两种不同的信息来源，既考虑了特征的局部细节，又考虑了全局的模式关联。最后，为了进一步优化图像表示，算法利用图像的类内相似性和类间差异性，构建了一种优化策略，以确定最佳的阈值。这个阈值用于将图像表示转化为二进制的哈希值，以适应高效的图像检索任务。哈希函数的目的是尽可能地保持相似图像的哈希码相近，而不同图像的哈希码尽可能远，从而实现快速的近似最近邻搜索。在实验部分，该方法被应用于三个标准的图像检索数据集——holiday、Oxford和Paris，与其他优秀的图像表示方法进行了对比。实验结果验证了所提出的深度哈希图像表示方法在提高图像检索性能方面的有效性。这项工作通过深度学习和数据挖掘技术的结合，提出了一种新的图像表示策略，它不仅考虑了深度特征描述子，还考虑了特征之间的关联性，从而提高了图像检索的准确性和效率。这对于深度学习在图像处理和计算机视觉领域的应用具有重要的理论和实践意义。

收稿日期：２０１９０６０６；修回日期：２０１９０７１２　　基金项目：国家社会科学基金资助项目（１７ＢＴＱ０６８）；河北省自然科学基金资助项目

（Ｆ２０１８５１１００２，Ｇ２０１８２０４０９３）；河北省高等学校科学技术研究项目（Ｚ２０１９０３７）；中央司法警官学院校级科研项目（ＸＹＺ２０１６０２）；河北大学中西部提

升综合实力专项；河北省高等学校科学研究项目青年基金资助项目（ＱＮ２０１８０８４）；河北农业大学校理工基金资助项目（ＬＧ２０１８０４）；河北农业大学

自主培养人才科研专项资助项目（ＰＹ２０１８１０）；交通数据分析与挖掘北京市重点实验室开放课题

作者简介：朱杰（１９８２），男，河北保定人，副教授，博士，主要研究方向为机器学习、机器视觉；张楠楠（１９８１），女，山东莱州人，副教授，博士，

主要研究方向为数量经济学；刘太行（

１９８９），男，河北文安人，助教，硕士研究生，主要研究方向为机器学习；刘博（１９８１），男，河北保定人，教授，

博士，主要研究方向为机器学习、计算机视觉；吴树芳（１９８０），女（通信作者），河北邯郸人，副教授，博士，主要研究方向为机器学习、机器视觉

（ｓｈｕｆａｎｇ＿４４＠１２６．ｃｏｍ）．

融合特征关联性的深度哈希图像表示方法



朱　杰

１

，张楠楠

１

，刘太行

１

，刘　博

２

，吴树芳

３

（１．中央司法警官学院信息管理系，河北保定０７１０００；２．河北农业大学信息科学与技术学院，河北保定

０７１０００；３．河北大学管理学院，河北保定０７１０００）

摘　要：针对深度描述子无法提供图像特征之间关联性的问题进行了研究，提出了一种融合特征关联性的深度

哈希图像表示方法，这种方法将深度描述子之间的关系融入到图像内容的描述中，用于提高图像检索性能。首

先，通过预训练网络生成图像的特征映射，并在此基础上提取出深度特征描述子。然后，将深度特征描述子映射

为深度视觉词，从而用于深度视觉词的频繁项集发现。接下来将离散值的深度视觉词图像表示和哈希值的频繁

项集图像表示连接生成图像表示。最后，算法通过图像类内、类间的相似性关系构造优化，得到最优的阈值，用

于将图像表示变为哈希值。实验中，将提出的方法与一些优秀的图像表示方法在ｈｏｌｉｄａｙ、Ｏｘｆｏｒｄ和Ｐａｒｉｓ图像集

的图像检索任务中进行了性能比对，用于证明此方法的有效性。

关键词：深度特征描述子；深度视觉词图像表示；频繁项集图像表示；优化的阈值

中图分类号：ＴＰ３９１　　　文献标志码：Ａ　　　文章编号：１００１３６９５（２０２０）１００６５３１９７０４

ｄｏｉ

：１０．１９７３４／ｊ．ｉｓｓｎ．１００１３６９５．２０１９．０６．０１６９

Ｆｅａｔｕｒｅｒｅｌｅｖａｎｃｅｆｕｓｉｏｎｂａｓｅｄｄｅｅｐｈａｓｈｉｎｇｆｏｒｉｍａｇｅｒｅｐｒｅｓｅｎｔａｔｉｏｎ

ＺｈｕＪｉｅ

１

，ＺｈａｎｇＮａｎｎａｎ

１

，ＬｉｕＴａｉｈａｎｇ

１

，ＬｉｕＢｏ

２

，ＷｕＳｈｕｆａｎｇ

３

（１．Ｄｅｐｔ．ｏｆＩｎｆｏｒｍａｔｉｏｎＭａｎａｇｅｍｅｎｔ，ＮａｔｉｏｎａｌＰｏｌｉｃｅＵｎｉｖｅｒｓｉｔｙｆｏｒＣｒｉｍｉｎａｌＪｕｓｔｉｃｅ，ＢａｏｄｉｎｇＨｅｂｅｉ０７１０００，Ｃｈｉｎａ；２．ＣｏｌｌｅｇｅｏｆＩｎｆｏｒｍａ

ｔｉｏｎＳｃｉｅｎｃｅ＆Ｔｅｃｈｎｏｌｏｇｙ

，ＨｅｂｅｉＡｇｒｉｃｕｌｔｕｒａｌＵｎｉｖｅｒｓｉｔｙ，ＢａｏｄｉｎｇＨｅｂｅｉ０７１０００，Ｃｈｉｎａ；３．ＣｏｌｌｅｇｅｏｆＭａｎａｇｅｍｅｎｔ，ＨｅｂｅｉＵｎｉｖｅｒｓｉｔｙ，

ＢａｏｄｉｎｇＨｅｂｅｉ０７１０００，Ｃｈｉｎａ）

Ａｂｓｔｒａｃｔ：Ｔｈｉｓｐａｐｅｒｓｔｕｄｉｅｄｐｒｏｂｌｅｍｔｈａｔｔｈｅｄｅｅｐｄｅｓｃｒｉｐｔｏｒｓｃａｎｎｏｔｐｒｏｖｉｄｅｔｈｅｃｏｒｒｅｌａｔｉｏｎｂｅｔｗｅｅｎｔｈｅｆｅａｔｕｒｅｓ．Ｔｈｉｓｐａｐｅｒ

ｐｒｏｐｏｓｅｄａｆｅａｔｕｒｅｒｅｌｅｖａｎｃｅｆｕｓｉｏｎｂａｓｅｄｄｅｅｐｈａｓｈｉｎｇｍｅｔｈｏｄｔｏｉｎｃｏｒｐｏｒａｔｅｔｈｅｒｅｌａｔｉｏｎｓｈｉｐｂｅｔｗｅｅｎｄｉｆｆｅｒｅｎｔｄｅｅｐｄｅｓｃｒｉｐ

ｔｏｒｓｉｎｔｏｔｈｅｄｅｓｃｒｉｐｔｉｏｎｏｆｔｈｅｉｍａｇｅｃｏｎｔｅｎｔｓ．Ｆｉｒｓｔｌｙ，ｉｔｅｘｔｒａｃｔｅｄｔｈｅｆｅａｔｕｒｅｍａｐｓｆｒｏｍｔｈｅｐｒｅｔｒａｉｎｅｄｎｅｔｗｏｒｋａｎｄｕｓｅｄｆｏｒ

ｄｅｅｐｄｅｓｃｒｉｐｔｏｒｇｅｎｅｒａｔｉｏｎ．Ｔｈｅｎ

，ｉｔｍａｐｐｅｄｔｈｅｓｅｄｅｓｃｒｉｐｔｏｒｓｔｏｄｅｅｐｖｉｓｕａｌｗｏｒｄｓ，ａｎｄａｌｓｏｅｘｐｌｏｒｅｄｔｈｅｆｒｅｑｕｅｎｔｉｔｅｍｓｅｔ

ｂａｓｅｄｏｎｔｈｅｓｅｄｅｅｐｖｉｓｕａｌｗｏｒｄｓ．Ｎｅｘｔ，ｉｔｃｏｎｃａｔｅｎａｔｅｄｄｅｅｐｖｉｓｕａｌｗｏｒｄｓｂａｓｅｄｉｍａｇｅｒｅｐｒｅｓｅｎｔａｔｉｏｎｏｆｄｉｓｃｒｅｔｅｖａｌｕｅｓａｎｄｆｒｅ

ｑｕｅｎｔｉｔｅｍｓｅｔｂａｓｅｄｉｍａｇｅｒｅｐｒｅｓｅｎｔａｔｉｏｎｏｆｂｉｎａｒｙｖａｌｕｅｓｔｏｒｅｐｒｅｓｅｎｔａｎｉｍａｇｅ．Ｆｉｎａｌｌｙ，ｉｔｆｏｒｍｕｌａｔｅｄａｎｏｐｔｉｍｉｚａｔｉｏｎｂａｓｅｄｏｎ

ｔｈｅｉｎｔｒａｃｌａｓｓａｎｄｉｎｔｅｒｃｌａｓｓｓｉｍｉｌａｒｉｔｉｅｓｂｅｔｗｅｅｎｉｍａｇｅｓｔｏｏｂｔａｉｎｔｈｅｏｐｔｉｍａｌｔｈｒｅｓｈｏｌｄｓｔｏｃｏｎｖｅｒｔｔｈｅｉｍａｇｅｒｅｐｒｅｓｅｎｔａｔｉｏｎ

ｉｎｔｏａｂｉｎａｒｙｓｔｒｉｎｇ．Ｅｘｔｅｎｓｉｖｅｅｘｐｅｒｉｍｅｎｔｓｓｈｏｗｔｈａｔｃｏｍｐａｒｅｄｗｉｔｈｓｏｍｅｓｔａｔｅｏｆｔｈｅａｒｔｍｅｔｈｏｄｓ，ｔｈｅｐｒｏｐｏｓｅｄｍｅｔｈｏｄｃａｎ

ａｃｈｉｅｖｅｓａｔｉｓｆｙｉｎｇｒｅｔｒｉｅｖａｌｐｅｒｆｏｒｍａｎｃｅｉｎｔｈｅｈｏｌｉｄａｙ，ＯｘｆｏｒｄａｎｄＰａｒｉｓｉｍａｇｅｄａｔａｂａｓｅｓ．

Ｋｅｙｗｏｒｄｓ：ｄｅｅｐｆｅａｔｕｒｅｄｅｓｃｒｉｐｔｏｒｓ；ｄｅｅｐｖｉｓｕａｌｗｏｒｄｉｍａｇｅｒｅｐｒｅｓｅｎｔａｔｉｏｎ；ｆｒｅｑｕｅｎｔｉｔｅｍｓｂａｓｅｄｉｍａｇｅｒｅｐｒｅｓｅｎｔａｔｉｏｎ；

ｏｐｔｉｍａｌｔｈｒｅｓｈｏｌｄｓ

０　引言

近年来，卷积神经网络（ｃｏｎｖｏｌｕｔｉｏｎａｌｎｅｕｒａｌｎｅｔｗｏｒｋ，ＣＮＮ）

已经被广泛应用于计算机视觉相关任务，如图像分类

［１，２］

、图

像分割

［３，４］

和行人检测

［５，６］

等。其主要特点在于通过训练网络

参数，从而学习复杂事物的特性。ＣＮＮ在大规模图像检索问

题上也表现出了优异的性能。研究表明，经过大规模图像分类

任务训练后的

ＣＮＮ可以用于完成与训练图像集合不同内容的

图像表示任务，并应用于图像检索。从预训练深度网络中提取

的激活特征可以用于构成深度描述子，从而描述图像特征。

Ｂａｂｅｎｋｏ等人

［７］

开创性地将神经元的激活作为特征，并将聚合

后的特征成功地应用到了图像检索任务中。Ｒａｚａｖｉａｎ等人

［８］

提出了一种将ＣＮＮ全连接层和卷积层响应进行聚合用于图像

表示的方法。Ｇｏｎｇ等人

［９］

在生成的特征映射基础上，提取出

多尺度局部特征映射的激活特征，用于特征聚合生成图像表

示。

Ｗｅｉ等人

［１０］

通过特征映射粗略分析出对象区域，并将此

区域内的特征聚合生成图像表示。接下来的研究中发现，通过

对激活特征在不同层次和不同位置进行加权，可以更好地描述

图像内容

［１１，１２］

。在后来的工作中，张艺超等人

［１３］

提出了一种

有监督的多尺度平衡深度哈希方法用于提高图像检索性能。

Ｊｉ等人

［１４］

在语义嵌套空间内将可见领域的知识转移到不可见

领域，用于提高多模型检索问题的性能。

作为一种优秀的算法，

Ｎｇ等人

［１５］

将深度描述子通过聚类

生成字典，并通过局部聚合向量（ｖｅｃｔｏｒｏｆｌｏｃａｌｌｙａｇｇｒｅｇａｔｅｄｄｅ

ｓｃｒｉｐｔｏｒｓ，ＶＬＡＤ）的编码方式生成图像表示。算法中，字典的生

第３７卷第１０期

２０２０年１０月　

计算机应用研究

ＡｐｐｌｉｃａｔｉｏｎＲｅｓｅａｒｃｈｏｆＣｏｍｐｕｔｅｒｓ

Ｖｏｌ３７Ｎｏ１０

Ｏｃｔ．２０２０

下载后可阅读完整内容，剩余3页未读，立即下载

weixin_38516956

粉丝: 6
资源: 973

深度哈希图像表示：融合特征关联性的新方法

深度哈希图像检索综述

多模态数据多样性的融合和关联.pptx

基于深度学习的图像检索系统 (1).pdf

代码向量深度学习的恶意Android应用检测方法.pdf

语义自编码哈希提升跨模态检索效率与深度关联

深度学习驱动的无监督视频哈希框架

【10分钟掌握】：数据结构与算法的关联性深度剖析

图像融合秘诀：OpenCV图像融合技术详解

图像检索新突破：深度度量学习实战指南，快速提升检索精度

3. 选择适用的哈希函数

最新资源