深度产品量化(DPQ):端到端监督的图像检索新方案

PDF格式 | 602KB | 更新于2025-01-16 | 83 浏览量 | 0 下载量 举报
收藏
"本文介绍了一种新的图像搜索和检索方法——端到端监督乘积量化(DPQ),该方法在保持与传统乘积量化(PQ)类似的计算复杂性和内存占用的同时,提高了检索和分类的准确性。DPQ是受到PQ启发并结合了深度学习的端到端学习方法,它能够利用监督信号进行更有效的非对称搜索。" 在图像搜索和检索领域,乘积量化(Product Quantization, PQ)是一种常用的技术,它将高维特征空间近似为低维字典,从而实现快速的近似最近邻搜索。PQ通过将特征空间分割成多个不相交的分区,然后在每个分区上进行聚类,将输入向量编码为二进制形式,减少了存储和计算成本。然而,PQ是一种无监督方法,未充分利用标注数据。 随着监督学习的发展,研究者开始转向使用监督的无字典方法,如二进制表示,这些方法在保持高效的同时,通过监督学习改进了汉明距离的计算,提高了性能。论文提出的深度产品量化(Deep Product Quantization, DPQ)则是在PQ基础上的创新,它结合了深度学习,使得模型能够端到端地学习,并且利用监督信号,从而提高了检索和分类的准确性。 DPQ的关键在于它不仅学习硬表示,还学习了软表示,这使得非对称搜索变得更加有效。通过直通估计(Straight-Through Estimator)策略,DPQ在训练过程中能够处理连续的、非离散的表示,而在推理时则使用离散的编码,从而在保持效率的同时,提升了检索性能。 在实验部分,DPQ在多个基准测试上展示了优于现有先进技术的结果,证明了其在图像搜索和检索任务中的优越性。这种方法为大规模图像数据库的近似最近邻搜索提供了一个新方向,特别是在需要考虑效率和精度平衡的场景下。 端到端监督乘积量化(DPQ)是一种结合了传统乘积量化优势和深度学习监督学习能力的新型图像检索方法,它在保持低计算复杂性和内存占用的同时,显著提升了检索的准确性,对于大规模图像数据库的管理和应用具有重要意义。

相关推荐

手机看
程序员都在用的中文IT技术交流社区

程序员都在用的中文IT技术交流社区

专业的中文 IT 技术社区,与千万技术人共成长

专业的中文 IT 技术社区,与千万技术人共成长

关注【CSDN】视频号,行业资讯、技术分享精彩不断,直播好礼送不停!

关注【CSDN】视频号,行业资讯、技术分享精彩不断,直播好礼送不停!

客服 返回
顶部