深度学习实例感知哈希:多标签图像检索新方法

0 下载量 172 浏览量 更新于2024-08-26 收藏 2.56MB PDF 举报
"多标签图像检索的实例感知哈希" 在图像检索领域,相似性保留的哈希技术是一种高效的方法,用于在大规模数据集中快速找到最接近的邻居。随着深度学习的发展,基于深度网络的哈希方法越来越受到关注,因为它们能够同时学习到图像的有效表示和紧凑的哈希编码。然而,对于具有多个标签(即包含多个对象或类别)的图像,传统的语义哈希方法——将每个图像表示为单一的哈希码,可能并不理想。 本文提出的"实例感知哈希"针对多标签图像检索问题进行了创新。作者Hanjiang Lai、Pan Yan、Xiangbo Shu、Yunchao Wei和Shuicheng Yan(均为IEEE资深会员)指出,现有的哈希方法忽视了图像内部不同类别之间的差异。为解决这一问题,他们设计了一个深度学习架构,该架构能学习到多标签图像的实例感知图像表示。这些表示被分组,每个组对应图像中的一个类别,包含了该类别对象的特征。 实例感知表示不仅强化了语义哈希的性能,还引入了类别感知哈希的概念。在类别感知哈希中,每个图像不再由单一的哈希码表示,而是由多个哈希码表示,每个码对应图像中的一个类别。这种分离的表示方式使得在检索时可以针对每个类别独立地进行匹配,提高了检索的精度和效率。 通过在多个基准数据集上的实验,如COCO、MS COCO、NUS-WIDE等,文章展示了所提方法在语义哈希和类别感知哈希任务上相比于最新监督和无监督哈希方法的显著改进。实验结果证实,这种方法在保持相似性的同时,提高了多标签图像检索的准确性和召回率,证明了其在图像检索领域的优越性。 "实例感知哈希"是一种适应多标签图像检索需求的新颖方法,它利用深度学习捕捉图像的多类别特性,通过实例和类别感知的表示,提升了哈希编码的质量,从而优化了大规模图像检索的效果。这项工作为深度学习在图像检索领域的应用提供了新的视角和研究方向。