浅析 CBIR 中基于 SVM 的相关反馈算法
摘要: 在当今的图像管理和网络搜索中,基于内容的图像获取收到越来越多的关注。在最近的几年里,为
了 获 取 用 户 的 喜 好 和 促 进 CBIR ( content-based image retrieval ) 系 统 性 能 的 提 升 , 相 关 反 馈
(RF,relevance feedback)作为一种重要的工具被提出并发展。SVM 在最近的几年内是一种非常流行的
小样本学习方法。由于它具有较强的泛化能力,所以在不同的应用程序中可以得到顶级的性能。本文主要
介绍了一些基于 SVM 的相关反馈算法,着重从其发展过程,具体算法描述和优缺点来进行整体介绍。
关键字:CBIR,RF,SVM
1.介绍
CBIR
[1]
是一种从图像数据库中获取图像的技术,被获取的图像和用户提交的查询图像
具有语义相关性。这种方法是采用基于可视化特征的方法来表达图像。这些可视化特征可
以自动地从图像中抽取,比如颜色、纹理和形状。然而低水平的图像特征和高水平的语义
理解之间的差距成为影响系统性能提升的瓶颈。 RF
[2]
是一种有缩短两者之间差距和提升
CBIR 系统性能的有效的方法。RF 通过要求用户来语义地对反馈进行正或者负的分类的方
法来关注用户和搜索引擎之间的交互。基于用户的反馈信息,RF 方案核心的问题是如何快
速地构建一个合适的分类器。然而这种构建过程和传统的分类过程有很大的不同之处,因
为用户不喜欢提供大量的反馈信息。因此在 RF 过程中,小样本的学习方法将会是一种非
常有前途的方法。
SVM
[3]
是一种近几年用的比较流行的小样本学习方法,由于它具有较强的泛化能力所
以可以获得较高的性能。SVM 通过最小化 VC 维和达到最小结构化风险来获得模式分类问
题的非常好的性能。基于 SVM 的 RF 非常流行是因为在训练集小的情况下获得的性能可以
优于其他分类器。接下来的内容安排如下:通过介绍几个典型的基于 SVM 的 RF 的演变过
程中的几个方案来认识 SVM 和 RF 结合的方法。主要的有传统的 SVM-based RF
[4]
、SVM
-based RF
[5]
、正交补构成分析(orthogonal complement component analysis , OCCA )
[6]
、Kernel empirical OCCA( KEOCCA )
[6]
。
2.算法介绍
2.1 传统的 SVM-based RF 算法
[4]
在处理反馈的过程中,用户可以标记一个图像相关或者不相关。考虑到把初次结果的
Top 作为训练数据集,可以用 SVM 来实现分两个类的学习算法,并且构造一个合适的分类
器来表达用户的查询概念。在这之后,其他图像可以分类为相关类和不相关类,这主要是
有各个图像距离分类超平面的距离来确定的。这种距离确定类型的方法可以获得较好的结
果。具体过程如下:
⑴通过传统的方法进行检索。
评论2