深度学习驱动的显著性区域图像检索算法研究

需积分: 10 1 下载量 145 浏览量 更新于2024-09-07 1 收藏 927KB PDF 举报
"基于深度学习的显著性区域的图像检索研究" 这篇研究论文探讨了如何通过深度学习技术改进图像检索的精度,特别是针对图像全局特征中的冗余信息问题。作者王立新和江加和来自北京航空航天大学自动化科学与电气工程学院,他们提出了一种基于VGG16深度学习模型的改进网络结构,旨在保留图像的空间信息并提取图像显著性区域的局部特征。 传统的图像检索方法常常依赖全局特征,但这些特征可能包含大量冗余信息,影响检索的准确性。为此,研究者采用了VGG16,一个经典的卷积神经网络(CNN),作为基础模型,并对其进行了优化。在训练过程中,他们利用改进的网络模型对数据进行训练,以获得高精度的模型。训练完成后,他们运用类激活映射(Class Activation Mapping, CAM)技术来定位图像中的显著性区域。CAM是一种能揭示网络关注的图像关键区域的技术,有助于突出图像中的重要部分。 接下来,研究者利用同一模型提取这些显著性区域的局部特征,构建了一个图像数据库。在查询图像时,他们采用L2距离比较函数来计算查询图像与数据库中图像之间的相似度,根据相似度大小返回最匹配的图像。这种方法强调了局部显著性特征的重要性,从而提高了检索的精度。 在Corel数据集上进行的实验表明,相比于仅使用神经网络全局特征或传统的尺度不变特征变换(Scale-Invariant Feature Transform, SIFT)特征构建的K-means模型,利用局部显著性区域特征的检索方法表现更优。实验结果证实了该模型在图像检索方面的良好性能。 论文的关键字包括:图像检索、卷积神经网络、局部特征、全局特征、显著性区域、相似度、深度学习和模型训练。它被归类在计算机技术与应用领域,文献标志码为A,文章编号为1009−671X(2018)06−0063−05,具有重要的理论和实际应用价值,对于提升图像检索系统的性能有着积极的贡献。