双层视觉密码本提升图像表示有效性：一种新颖的量化与检索方法

71 浏览量更新于2024-08-26 收藏 771KB PDF 举报

本文主要探讨的是"基于双层视觉密码本的有效图像表示"这一主题，针对在图像分类和检索应用中广泛使用的视觉词袋(BoW)模型存在的问题——量化误差对表示效果的影响。传统的视觉代码书构建方法通常通过将局部特征聚类成组，然而原始特征被硬量化到最近的中心时，可能会导致较大的量化误差，从而影响BoW表示的准确性。作者们提出了一种新颖的解决方案，即构建双层视觉码本。这种方法旨在显著减少量化误差，首先在第一层码本中进行粗粒度的编码，然后在第二层进行更为精确的处理。这种双层次结构允许更灵活地量化，避免了单一层次的局限性。他们借鉴了局限性线性编码(LinUCB)方法的思想，并在此基础上提出了基于岭回归的量化方法。这个量化过程允许每个局部特征被分配给多个视觉词，而不是仅仅一个，从而减少了因硬量化引起的误差。同时，集成k最近邻策略进一步提高了量化效率，使得图像表示更加精细且高效。为了验证新方法的有效性，研究者们将提出的图像表示与现有的基准技术进行了对比实验，选择了两个图像分类数据集作为测试平台。实验结果显示，他们的方法在保持高精度的同时，明显优于现有的软量化技术，证明了双层视觉密码本在图像表示中的优越性能。本文的贡献在于提供了一种创新的图像表示策略，通过双层视觉码本和改进的量化方法，有效解决了BoW模型中的量化误差问题，对于提升图像分类和检索任务的性能具有实际价值。这对于那些依赖于视觉词袋模型的计算机视觉应用开发者来说，无疑是一个值得深入研究和应用的突破。

weixin_38685455

粉丝: 5
资源: 922

双层视觉密码本提升图像表示有效性：一种新颖的量化与检索方法

基于双层级联GAN的草图到真实感图像的异质转换1

一种基于双层框架的仿射类图像抠像方法.docx

基于双层湿纸嵌入的自适应图像隐写算法

基于双层PLSA模型的多标签图像标注

基于双层全连接神经网络和ResNet网络实现的图像二分类问题

论文研究-基于双层反卷积的宽场荧光显微图像盲复原.pdf

基于上下文样例分类器的图像表示

基于凯撒与XOR双层加密的密码学趣味解密题目

基于双层优化规划的微电网优化

基于像素及梯度域双层深度卷积神经网络的页岩图像超分辨率重建.pdf

最新资源