形状词驱动的草图图像检索方法

0 下载量 116 浏览量 更新于2024-08-26 收藏 1.36MB PDF 举报
"这篇研究论文探讨了通过形状词进行基于草图的图像检索技术,旨在提升检索效率和准确性,同时降低内存需求。" 在当前触摸屏设备广泛应用的背景下,基于草图的图像检索已经成为一个重要的研究领域。然而,现有的大多数工作主要集中在形状和草图的低级描述符上。这篇由上海交通大学、微软研究院和微软公司共同完成的研究论文提出了利用形状词(ShapeWords)作为描述符的新方法,以改进这一领域的技术。 首先,论文定义了形状词的概念,并设计了一种高效的算法来提取这些形状词。形状词是能够捕捉图像形状特征的关键元素,它们可以更准确地描述草图的轮廓和结构。这种方法比传统的基于形状的描述符更为抽象和语义化,有助于提高检索的精确度。 接着,论文将经典的查米弗匹配算法(Chamfer Matching)进行了推广,以解决形状词的匹配问题。查米弗匹配通常用于计算两个形状之间的距离,但在此处被扩展以适应形状词的特性,从而实现更精细的匹配。 最后,为了应对大规模图像数据库的检索需求,论文提出了一种新颖的倒排索引结构。这种结构优化了形状词表示的可扩展性,使得在保持高精度的同时,大大降低了内存占用。实验结果显示,该方法的准确性具有竞争力,且内存需求仅为MindFinder的3%以下,显著提升了检索系统的效率和实用性。 这篇论文为基于草图的图像检索提供了新的思路,通过形状词的引入,不仅提高了检索的准确性,还实现了对大规模数据集的高效处理,对于移动设备和云端应用中的图像检索技术具有重要的推动作用。未来的研究可能会进一步探索形状词在复杂场景识别、多模态检索以及实时搜索等领域的应用。