混合属性提升零样本图像分类性能

需积分: 5 2 下载量 79 浏览量 更新于2024-08-26 1 收藏 2.9MB PDF 举报
"这篇研究论文探讨了一种名为‘基于混合属性的零样本图像分类’的方法,旨在解决在有限维度的语义属性下,基于属性的零样本图像分类器难以准确区分相似类别的问题。作者程玉虎、乔雪和王雪松来自中国矿业大学信息与控制工程学院。该研究受到国家自然科学基金和中央高校基本科研业务费的支持。" 正文: 零样本图像分类(Zero-Shot Image Classification)是一种计算机视觉领域的挑战性任务,它允许模型在未见过的类别上进行分类,仅依赖于类别间的语义属性关联。在传统的深度学习或机器学习方法中,模型需要大量的标记数据进行训练,但在零样本情况下,模型必须利用类别描述(通常是文本形式的语义属性)来推断未知类别。 本文提出的Hybrid Attribute-Based Direct Attribute Prediction (HA-DAP)模型,是在Direct Attribute Prediction (DAP)模型基础上的改进。DAP模型直接预测图像的语义属性,然后利用这些属性进行分类。然而,由于语义属性可能无法完全捕捉图像的所有特性,特别是在区分具有相似属性的类别时,这种方法可能会受限。 HA-DAP模型引入了非语义属性的概念,通过对图像的底层特征进行稀疏编码,提取出辅助性的非语义属性。稀疏编码是一种降维技术,它可以将高维特征空间压缩到低维表示,同时保持关键信息。这种非语义属性与语义属性结合,形成了混合属性,为DAP模型提供了一个更丰富的属性中间层。 在训练过程中,HA-DAP模型利用混合属性构建分类器,通过属性预测模型的思想训练这个分类器。测试阶段,模型会预测测试样本的混合属性,再依据属性与类别之间的预先定义关系预测类别标签。 实验在OSR、PubFig和Shoes数据集上验证了HA-DAP模型的效果,结果显示其分类性能优于DAP模型,不仅提高了零样本图像分类的精度,还取得了较高的AUC(Area Under the Curve)值,这表明模型在辨别正负样本时的性能更优。 这篇论文提出了一个创新的解决方案,通过结合语义和非语义属性,改善了零样本图像分类的准确性,为解决计算机视觉中的这一难题提供了新的思路。这种方法对于未来的无监督学习、跨域识别等应用场景有着重要的理论和实践意义。