自适应代码驱动图提升无监督散列方法的性能

0 下载量 31 浏览量 更新于2024-06-20 收藏 1MB PDF 举报
本文主要探讨了在无监督散列方法中自适应代码驱动图的瓶颈传递机制的应用。传统无监督散列技术依赖于预先计算的相似图或随机锚点,这种分离处理方式可能导致数据相关性偏差,影响检索性能。作者提出了一种创新的方法,即通过结合自动编码器的上下文,构建有效的自适应代码驱动图,以解决这些问题。 在新方法中,作者设计了一个包含两个瓶颈的架构:一个是二进制代码(代码驱动),它捕捉数据的高级结构并传递给另一个连续变量,用于低级细节信息的处理。这个连续变量进一步接收来自编码器更新的网络反馈,促进学习更加区分性的二进制码。这种方法的优势在于,它能够在一个联合学习框架中实时更新图结构,减少数据相关性偏见,并且编码器的学习过程可以简单地通过梯度下降优化,同时保持二进制约束。 文章的核心技术包括自动编码器的图卷积操作,以及利用反向传播求解目标集合,这使得模型能够在编码和解码过程中协同工作,提高搜索的准确性和效率。与传统的监督和无监督散列技术相比,这种代码驱动图的引入提供了更优的ANN(近似最近邻)搜索解决方案。 实验结果显示,作者的新框架在基准数据集上显著优于当前最先进的哈希方法,证明了其在实际应用中的有效性。研究者提供了开源代码,以便于其他研究人员进一步验证和扩展这一研究成果。这项工作对于提升无监督散列算法的性能和适应性具有重要意义,为大数据时代的高效搜索提供了新的思路。