基于锚图的深度哈希方法及其在检索性能上的优化

78 浏览量更新于2023-10-12 收藏 664KB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

9796基于锚图的陈宇东1，2，黎智辉1，3，丁玉娟4，林凯怡5，黄伟强41深圳大学计算机科学与软件工程学院2深圳大学广东省智能信息处理重点实验室3深圳市社会人工智能与机器人研究所4香港理工大学纺织及制衣研究所，中国香港5北京大学软件与微电子学院，中国北京摘要最近，提出了一系列用于二进制代码学习的深度监督哈希方法。然而，由于计算量大和硬件存储空间有限因此，剩余的标记数据不能被充分利用，模型不能直接获得整个训练集的二进制代码进行检索。为了解决这些问题，本文提出了一个有趣的正则化深度模型，通过使用锚图无缝集成深度哈希和高效二进制代码学习的因此，深度特征和标签矩阵可以联合用于优化二进制码，并且网络可以从学习的比特的线性组合获得更具鉴别力的反馈。此外，我们还揭示了算法的机制和计算本质。在三个大规模数据集上的实验表明，与已有的深度哈希方法相比，该方法在训练时间较短的情况下取得了更好的检索性能.1. 介绍散列方法被广泛用于学习一组用于特征表示的二元码。由于特征只包含值0和1，我们可以快速测量大规模数据集上的数据点之间的汉明距离，用于图像检索。由于具有理想的二进制特性，散列已广泛应用于一些相关领域，例如大规模聚类[36]，协作过滤[34]和草图检索[26，19]。现有的散列方法可以分为两类，即，数据独立方法和数据依赖方法。传统的数据无关方法局部性*通讯作者：Z.莱（莱智hui@163.com）.敏感哈希（LSH）[6]通过使用随机投影矩阵可以非常快速地获得二进制代码。由于LSH的简单性，还发展了LSH的一些扩展[4，14]。然而，这些方法需要更多的比特来表示数据以获得高检索精度。另一方面，数据依赖的方法可以通过使用大量的训练数据来学习哈希函数，从而获得更有效的二进制码。非监督方法，如谱散列（SH）[30]和局部线性散列（LLH）[10]，旨在保留二进制空间中数据集的流形结构。由于计算亲和度矩阵是耗时的，因此Anchor图散列（AGH）[20]设计锚点图以隐式地表征局部结构。此外，迭代量化（ITQ） [7]和联合稀疏哈希（JSH）[15]专注于通过向其优化模型添加旋转矩阵来减少信息损失为了利用训练数据的标记信息，提出了半监督散列（SSH）[28]，潜在因子散列（LFH）[35]和监督离散散列（SDH）[25]用于区分二进制代码学习。受单模态检索的出色性能的启发，一些散列方法，如共正则化散列（CRH）[38]，监督矩阵分解散列（SMFH）[27]和判别式跨模态散列（DCMH ）[32]，被设计用于跨模态检索。然而，由于这些方法是基于手工特征，它们缺乏特征学习的能力。为了解决这个问题，引入了基于深度神经网络的散列方法，其被称为深度散列方法[24，1]。近年来，深度神经网络由于能够有效地表征数据的非线性特性，大大提高分类性能而引起了人们的极大关注[9]。为了利用深度神经网络进行特征提取，提出了一些深度哈希方法，包括基于深度语义排名的哈希（DSRH）[37]，深度监督哈希（DSH）[18] 卷积神经网络哈希（ Convolutional Neural NetworkHashing，CNNH）97972[31]第30段。由于深度散列方法中的一些使用两个独立阶段来学习二进制代码，因此所学习的深度特征可能是二进制化的次优解决方案。最近的工作表明，端到端哈希方法可以大大提高学习的二进制代码的质量[24，11，33]。其中一个代表性的方法是深度成对监督哈希（DPSH）[17]。基于DPSH的框架，具有三重标签的深度监督哈希（DTSH）[29]将成对标签扩展到目标函数中的三重标签，深度监督离散哈希（DSDH）[16]添加判别项以更新二进制代码以进一步利用标记信息。端到端的深度哈希方法可以极大地提高其中n2是子集中样本的总数。散列方法的目标是学习一组用于特征表示的二进制代码我们用B都∈Rl×n1B部分∈R1×n2 表示二进制分别为Xall和Xpart的代码，其中l是长度的比特。传统的基于流形的散列方法的主要目的是将高维数据中嵌入的潜在流形结构保留到低维二进制空间中[30，20]。为此，这些方法通常尝试求解以下目标函数：Σn1证明检索性能。然而，由于高计算成本和有限的存储空间，minB所有i，j=1||2S ij||2Sij（一）方法通常从训练集中选择子集来更新网络。因此，在迭代学习过程中忽略了训练数据其中b毕竟我S. t. ball，i∈{−1，1}l是B的第i列且S∈Rn1×n1过程和模型不能直接获得训练集的最优二进制码。因此，该模型的区分度较低，并且在二进制代码学习过程中不可避免地会增加信息损失。在此基础上，提出了一种更有效的方法，充分利用已有的标记信息来提高算法的性能。本文提出了一种称为深度锚点图哈希（DAGH）的框架，用于深度哈希和有效的二进制代码学习。主要贡献如下：• 提出了一种有效的深度哈希方法，将子集中的样本作为锚点，并设计了一个是亲和矩阵。问题（1）的目的是最小化ball，i和ball，j之间的距离，如果xall，j是原始高维空间中xall，i的由于构建亲和矩阵对于大规模数据集是耗时的，AGH提出锚图来表征局部结构[20]。锚点图的核心思想是使用少量的锚点连接整个数据集，从而可以隐式地计算不同数据点之间的相似性。类似于问题（1），最近提出的一些深度哈希方法最小化了深度特征和二进制代码之间的信息损失，如下所示：Σn2回归公式来建立联系，锚点和所有二进制代码之间的关系因此，minB部分，Ui=1||2||2（二）可以得到训练集的精确二进制码并且可以避免信息丢失的问题。• 通过对算法流程的分析展示了该框架如何无缝集成深度哈希和高效的二进制代码学习• 我们在三个基准数据集上测试了检索性能。实验结果表明该方法比现有技术的散列方法执行得更好。2. 相关工作在所设计的模型中，我们用Xall∈Rm×n1来表示所有的训练样本，其中xall，i∈Rm是第i个样本向量，n1是样本总数的现有的深度哈希方法，如DPSH、DTSH和DSDH，首先从数据库中选择一个子集以形成训练子集，然后逐批更新神经网络为简单起见，我们将子集中S. t. b部分，i∈{−1，1}l其中， b 部分， i 是 B 部分的第 i 列，并且 U=[u1 ，u2，...， ui，..， un] ∈ Rl×n2是网络的输出。由于计算成本高，深度哈希方法-S通常从训练集中选择一个子集进行训练，并且还需要形成小批量数据以在内环中更新因此，解决问题（2）不能学习用于检索的最优B在下一节中，我们将介绍所提出的判别式二元码学习框架，以克服这一缺点。3. 深度锚图哈希如问题（2）中所示，先前的深度散列方法直接将深度特征回归到对应的二进制码以放松离散优化问题。因此，在每次迭代中，只能学习一个mini-batch二进制代码。因此，这些方法需要采用两步操作来获得整个训练集的最佳二进制码，这将导致信息丢失。9798−Θ）=∈所有所有所有所有δj2我B所有Z回归一，一，0,1,0,0,0,00,0,0,1,0,00,0,1,0,0,1UZTB标签所有锚CNN散列FC成对损失图1. DAGH概览。蓝色方框是神经网络部分，紫色方框是目标函数部分。通过设计基于锚图的目标函数，该框架可以实现以下两个目标.一方面，网络的输出和标签矩阵可以用来生成训练集的二进制码，另一方面，网络可以从学习的比特和成对损失中获得更有鉴别力和更有效的反馈。此外，由于网络在每次迭代中只适合一批二进制代码，因此在本文中，我们希望结合深度哈希和有效的二进制代码学习的优点，以提高检索性能和模型的泛化能力。因此，子集se-其中Zij是Z的第i行和第j列元素，δj是与uj相关的数据点的总数。由于n2n1，我们把Z看作锚图，并且它是相似的<

下载后可阅读完整内容，剩余1页未读，立即下载