深度跨模态汉明哈希：提升异质性下高效检索

200 浏览量更新于2024-06-20 收藏 1.05MB PDF 举报

跨模态汉明散列是一种创新的深度跨模态哈希方法，由Yue Cao、Bin Liu、Mingsheng Long和Jianmin Wang在清华大学软件学院和中国大数据软件国家工程实验室共同提出。他们针对大规模、高维跨模态数据检索的需求，旨在提高计算效率和检索质量。传统的跨模态检索通常依赖于深度学习来减少不同模态间的信息差距，如图像和文本，但依然面临异质性带来的挑战。该工作的主要创新在于引入了汉明空间检索的概念，这是一种利用散列查找而非线性扫描技术，能够在给定汉明半径内快速找到相关数据项的方法。然而，当前的跨模态散列方法在汉明空间检索中的效果有限，因为它们往往无法有效集中相关项到较小的汉明球内，而且不同模态间的散列码由于模态差异导致的汉明距离较大。跨模态汉明哈希（CMHH）通过设计基于指数分布的成对焦点损失函数，对那些汉明距离超过预设阈值的不匹配模态对施加显著惩罚。这种设计使得CMHH能够生成更为紧凑和高度集中的哈希码，从而支持高效的汉明空间检索。作者在NUS-WIDE、MIRFlickr-25K和IAPRTC-12等多个基准数据集上进行了大量实验，结果显示CMHH不仅能生成高质量的哈希码，还实现了最先进的跨模态检索性能，无论是通过哈希查找还是线性扫描。总结来说，跨模态汉明散列是一项突破性的技术，它通过深度学习和优化的哈希策略，解决了跨模态数据检索中的异质性和效率问题，为大规模跨模态数据处理提供了强大的工具。这不仅有助于提升搜索引擎和社交媒体中信息检索的效率，也为多媒体内容的理解和组织奠定了坚实的基础。

Yue Cao，Bin Liu，Mingsheng Long，and Jianmin

Wang

或相关性反馈，以生成有区别的紧凑散列码。代表性方法包括跨模态

相似性敏感散列（CMSSH）[3]、语义相关性最大化（SCM）[11]、量

化相关性散列（QCH）[12]和语义保持散列（SePH）[37]。

先前的浅跨模态散列方法不能利用跨不同模态的非线性相关性来

有效地桥接固有的跨模态异质性。深度多模态嵌入方法[38，39，

40，41]已经表明，深度网络可以更有效地桥接不同的模态最近的深

度哈希方法[14，15，16，42，43，44]在许多图像检索数据集上给出

了最先进的结果有几种跨模态深度哈希方法使用混合深度架构进行表

示学习和哈希编码，即深度视觉语义哈希（DVSH）[22]、深度跨模

态哈希（DCMH）[23]和相关哈希网络（CHN）[24]。DVSH是第一个

深度跨模态散列方法，可以实现高效的图像-句子跨模态检索，但它

不支持图像和标签之间的跨模态检索DCMH和CHN是并行工作，它们

采用成对损失函数来保持跨模态相似性并控制混合深度架构内的量化

误差。

先前的深度跨模态散列方法不符合汉明空间检索[30]，即散列查

找，通过早期修剪而不是线性扫描，从预先指定的小半径的汉明球中

丢弃不相关的项注意，散列桶的数量将随着汉明半径呈指数增长，并

且大的汉明球将是不可接受的。汉明空间检索效率低下的原因首先，

现有的方法采用了错误指定的损失函数，当两个相似点具有较大的汉

明距离时，损失函数的惩罚很小。其次，不同模态之间的巨大异质性

引入了大的跨模态汉明距离。因此，它们不能将相关点集中在具有小

半径的汉明球内。本文对比现有的方法，新的指定的损失函数的基础

上的指数分布，缩小了小汉明球内的数据点，使有效的哈希查找。据

我们所知，这项工作是第一个深度跨模态哈希方法对汉明空间检索。

跨模态汉明散列

在跨模态检索中，数据库由来自一种模态的对象组成，查询由来自另

一种模态的对象组成。我们通过深度学习从一个训练集捕获不同模态

之间的非线性相关性。

图像

{

}

和

文本

{

}

，其中

∈

RDx

表示D

分别地

，

∈

表示图像模态的D y维特征向量，并且y j ∈ R D y

表示文本模态的

维特征向量一些图像和数据对

与最小的表

深度跨模态汉明哈希：提升异质性下高效检索

汉明模拟：汉明模拟方法-matlab开发

汉明距离matlab代码-FDDH:“用于大规模跨模态检索的快速判别离散散列”的Matlab演示代码

用于可扩展跨模态检索的高效离散隐式语义散列

两个整数之间的汉明距离：汉明距离是对应符号不同的位置的个数-matlab开发

Bitcount & 按位汉明距离：计算向量中的集合位，并计算向量集合之间的按位汉明距离-matlab开发

有监督的跨模态检索的判别相关散列

用于 LBC 的 MATLAB 中的汉明斯代码：用于检测传输代码中的单个错误模式的汉明代码-matlab开发

基于语义自编码哈希学习的跨模态检索方法.docx

汉明过滤器：过滤器-matlab开发

汉明纠错码：Error Correction Hamming Code-matlab开发

最新资源