移动视觉搜索的精确离线扩展:提升召回率与效率

需积分: 5 0 下载量 29 浏览量 更新于2024-08-17 收藏 1.61MB PDF 举报
精确的离线查询扩展在大规模移动视觉搜索中的应用是当前研究的重要课题。移动视觉搜索利用智能手机摄像头捕获的图像进行搜索,然而,这种场景下的技术挑战主要源于两个方面:一是图像仿射变换,由于拍摄角度的变化,同一物体在不同视角下的图像会有显著差异;二是运动模糊,手部抖动可能导致图像质量下降。这两个因素降低了搜索的召回率,即正确识别目标图像的能力。 传统的查询扩展方法旨在提高检索准确性,但它们往往消耗大量内存和计算资源,且存在冗余特征的问题。针对这些问题,本文提出了一种新颖的解决方案。首先,作者引入了鲁棒的局部补丁挖掘技术,通过高效地筛选出图像中的关键区域,这些区域对于识别和区分不同视点下的对象至关重要。这一过程依赖于一种创新的准则,旨在评估并挖掘出最具代表性的局部补丁。 其次,从挖掘出的局部补丁中,提取出多维度的特征,这些特征能够有效地处理视点变化带来的影响,提高了匹配的稳定性和准确性。为了进一步加速匹配过程并保持精度,作者还记录了每个代表性视点的几何参数,如尺度、旋转和平移等,这些参数在匹配过程中作为参考,使得搜索更加精确和迅速。 在实验中,作者在多个知名的数据集以及一个包含一百万张大图像的大型数据集上测试了所提出的算法,结果显示其在召回率提升方面表现出色,尤其是在对抗视点变化的鲁棒性上。此外,该方法不仅适用于移动视觉搜索,也具有广泛的应用潜力,可以扩展到其他的多媒体内容分析任务中,如对象检测等。 总结来说,本文的工作为大规模移动视觉搜索提供了一个高效且精确的离线查询扩展框架,通过优化局部补丁挖掘和几何参数编码,有效解决了图像仿射变换和运动模糊带来的挑战,为提高移动设备上的搜索体验开辟了新途径。