独特相似哈希(USH):一种跨模态检索新框架

0 下载量 18 浏览量 更新于2024-08-03 收藏 1.07MB PDF 举报
"这篇论文是‘基于矩阵分解和相似性保持的跨模态检索研究’,由张心文发表在2023年的《计算机科学与应用》杂志第13卷第6期,页码为1264-1272。文中提出了一种新的跨模态检索框架——独特相似哈希(Unique Similar Hashing, USH),用于解决传统哈希方法在大数据场景中的语义提取效率低和运行速度慢的问题。USH采用两步学习策略,首先通过核函数进行非线性投影并利用矩阵分解学习潜在空间,然后学习哈希函数将样本映射至低维的汉明空间。在Wiki数据集上的实验结果显示,USH在平均精度(mAP)上有较好的表现,验证了其有效性。关键词包括哈希方法、跨模态检索和矩阵分解。" 这篇论文详细探讨了跨模态检索领域的一个关键问题,即如何在大规模数据中有效地进行多模态信息检索。传统的哈希方法在处理大数据时,由于语义提取效率和运行速度的限制,往往无法满足实际需求。作者张心文提出的独特相似哈希(USH)框架,旨在克服这些挑战。 USH的核心在于其两阶段的学习过程。首先,通过使用核函数,数据被非线性地投射到一个高维的核空间,这一操作有助于捕捉不同模态数据之间的复杂关系。接着,矩阵分解技术被应用于这个核空间,以学习一个潜在的连续表示,这个潜在空间能够保留数据的原始语义信息。 在矩阵分解的过程中,哈希码不是通过传统的量化过程得到的,而是直接计算其封闭解,从而避免了量化误差,保持了哈希码的离散特性。这种方法有助于减少信息损失,提高检索的准确性。在第二阶段,USH学习一个哈希函数,该函数可以将原始的多模态样本映射到低维的汉明空间,使得在有限的比特表示下,仍能保持较高的检索性能。 实验部分,USH在Wiki数据集上与其他最先进的方法进行了比较,显示出了较好的平均精度(mAP),这表明USH在跨模态检索任务上具有显著的优势和实用性。论文的关键贡献在于提供了一个既考虑哈希码离散约束又兼顾效率的解决方案,这对于处理大数据环境下的跨模态检索问题具有重要意义。 这篇论文对于理解和改进跨模态检索的效率和精度提供了新的视角,尤其是在处理大数据集时。通过矩阵分解和独特相似哈希的学习策略,USH提供了一种有效的方法来优化哈希码的生成和检索性能,对于计算机科学与应用领域的研究者和技术开发者来说,具有重要的参考价值。