多尺度深度哈希提升图像检索性能:新方法提高5.5%精度

需积分: 10 2 下载量 91 浏览量 更新于2024-09-07 收藏 1.31MB PDF 举报
本文研究的是一种多尺度平衡深度哈希图像检索方法,针对传统监督哈希方法存在的问题进行改进。传统方法通常将图像特征的学习和二进制码的量化过程分开,导致量化误差难以控制且无法保证生成的哈希码具有良好的平衡性。这种方法的创新之处在于: 1. 多尺度输入:通过引入多尺度输入,网络能够更全面地捕捉图像的不同细节和层次信息,从而提升对图像特征的有效学习。这种设计增强了模型对图像复杂性的适应性,使得网络能够更好地理解和表示图像。 2. 新的损失函数:研究人员提出了一个综合考虑的损失函数,它在保持语义相似性的同时,特别关注量化误差和哈希码的平衡性。这意味着在生成哈希码时,不仅注重相似图像之间的距离,还力求确保不同码字间的均匀分布,以避免热点效应,提高检索性能。 3. 深度哈希与卷积神经网络结合:深度哈希利用深度学习模型,特别是卷积神经网络(CNN),对图像进行高层次特征提取,这使得方法能够自动学习到图像的抽象特征,减少手动特征工程的需求。 4. 实验验证:该方法在CIFAR-10和Flickr数据集上进行了评估,结果显示,相比于当前先进的图像检索方法,其最佳检索精度分别提高了5.5%和3.1%,证明了该方法的有效性和优越性。 5. 团队成员:研究团队由张艺超、黄樟灿和陈亚雄组成,他们分别在计算机视觉、人工智能和模式识别等领域有深入研究,这也反映了文章背后的深厚学术背景和技术实力。 这篇论文提出了一种结合深度学习和多尺度策略的新型图像检索方法,旨在解决传统哈希方法的不足,提高图像检索的准确性和效率。通过实验证明,这种方法在图像处理领域具有显著的优势,对于提高大规模图像检索系统的性能具有重要的理论和实践价值。