5
3
年第 卷第 期
Electronic Sci& TechMay
h t t p://jo ur na lxidia ne ducn
收稿日期
基金 项 目 上 海 市 高 校 特 聘 教 授 东 方 学 者 岗 位 计 划
ESXX Research supported by The Program for Professor of
Special Appointment Eastern Scholar at Shanghai Institutions of
Higher LearningESXX
作者简介陆超文 男硕士研究生 研究方向图像
处理与模式识别 李菲菲 女博士教授 研究方
向多媒体信息处理图像处理与模式识别信息检索等 陈虬
男博士教授博士生导师 研究方向图像处理与
模式识别计算机视觉信息检索等
基 于 改 进 哈 希 算 法 的 图 像 检 索 方 法
陆超文李菲菲陈虬
上海理工大学 光电信息与计算机工程学院上海
摘要当前主流图像检索技术所采用的传统视觉特征编码缺少足够的学习能力影响学习得到的特征表达能力
此外由于视觉特征维数高会消耗大量的内存因此降低了图像检索的性能 文中基于深度卷积神经网络与改进的哈
希算法提出并设计了一种端到端训练方式的图像检索方法 该方法将卷积神经网络提取的高层特征和哈希函数相结
合学习到具有足够表达能力的哈希特征从而在低维汉明空间中完成对图像数据的大规模检索 在两个常用数据集上
的实验结果表明所提出的哈希图像检索方法的检索性能优于当前的一些主流方法
关键词图像检索卷积神经网络哈希算法视觉特征汉明空间特征编码特征维度
中图分类号TP文献标识码A文章编号
doi jcnkiissn
An Image Retrieval Algorithm Based on Improved Hashing Method
LU ChaowenLI FeifeiCHEN Qiu
School of Optical Electrical and Computer Engineering University of Shanghai for Science and
TechnologyShanghai China
AbstractThe coding methods of the traditional visual features adopted in current image retrieval approaches
lack sufficient learning ability and have no strong feature expression ability In addition due to the high dimensionali
ty of visual features a large amount of memory is consumed thus reducing the performance of image retrieval In this
paper an image retrieval algorithm with end to end training based on deep and improved hashing method was pro
posed and designed The proposed algorithm combined the high level features extracted by CNN with Hash function
and learned Hash codes with expression ability to perform large scale image retrieval in low dimensional Hamming
spaceThe experimental results on two main datasets showed that the retrieval performance of the proposed method
was superior to that of some state of the art ones
Keywordsimage retrievalconvolutional neural network Hashing methodvisual featureHamming spacefea
ture codingfeature dimension
近似最近邻搜索是一种有效的大规模图像检索策
略能够解决海量高维度下最近邻检索的问题 哈希
学习是学习一种保持图像相似性的紧密位表示使得
相似的图像能够匹配到相近的二进制哈希编码 基于
哈希的图像检索方法由于具有检索速度快存储成本
低等优点已成为研究的热点 根据利用图像标签信
息的程度现有基于学习的哈希方法大致分为两类无
监督哈希方法和有监督哈希方法 无监督哈希方法学
习具有未标记训练数据的哈希函数将输入图像编码
为二进制码 其中具有代表性的是局部敏感哈希Lo
cality Sensitive HashingLSH
其意在将相似的数据
匹配到相似的二进制编码的概率最大化 随后的研究
中大量无监督哈希学习算法被提出如谱哈希Spec
tral HashingSH
迭代量化 Iterative Quantization
ITQ
有监督哈希方法使用来自标记数据的监督
信息来学习哈希函数用于生成紧凑的二进制表示 例
如二进制重建嵌入Binary Reconstruction Embedding
BRE
提出了将样本点距离和相应的哈希码距离之
间误差最小化的方法 最小损失哈希 Minimal Loss
HashingMLH
构造了基于结构化支持向量机的哈
82
万方数据