Tri-training融合多特征提升图像检索效果

需积分: 9 0 下载量 83 浏览量 更新于2024-09-07 1 收藏 1.09MB PDF 举报
本文主要探讨了一种基于Tri-training的多特征融合图像检索方法。在现代图像检索领域,有效地利用图像的不同底层特征是提高检索性能的关键。论文的核心思想是将Tri-training算法应用于这一过程,旨在整合颜色、纹理和形状三个方面的特征,以提升检索的准确性和鲁棒性。 首先,作者们采用了三维量化颜色直方图来捕捉图像的颜色特性,这是一种统计方法,通过对图像像素的色彩分布进行量化和归一化,形成一个反映图像色彩分布特征的直方图。这种特征能够提供丰富的颜色信息,有助于区分不同的物体和场景。 其次,他们利用方向可控金字塔二值图像投影来提取纹理特征。这种方法通过构建金字塔结构,对图像进行不同尺度的二值化处理,突出纹理细节,使得纹理特征对于形状和光照变化具有一定的不变性,有助于增强检索的稳定性和可靠性。 再者,仿射不变区域被用来表示图像的形状特征。仿射不变区域关注的是对象在不同视角和变换下的不变部分,这使得形状信息在一定程度上独立于图像的尺度、旋转和位移,有助于减少检索时的误匹配。 Tri-training是一种有监督的多任务学习算法,它通过训练三个互相对抗的子模型来处理多个相关的分类任务。在这个应用中,三种特征的匹配值作为输入,通过Tri-training分类器进行训练和测试。这种策略使得模型能够更好地学习到不同特征之间的关联,从而提高了整体的检索性能。 实验结果显示,这种基于Tri-training的多特征融合方法显著提升了图像检索的效果,证明了融合多种底层特征的有效性。论文的研究不仅对图像检索技术有所贡献,还为其他领域的多模态数据融合提供了有益的思路。研究团队包括来自北京工商大学和北京工业大学的教授以及博士,他们在多媒体信息处理、图像/视频内容理解和智能信息处理等领域有着丰富的研究成果。 这篇论文的主要知识点包括 Tri-training算法的应用、三维量化颜色直方图、方向可控金字塔二值图像投影、仿射不变区域的特征提取,以及这些特征如何通过Tri-training进行融合以提升图像检索的性能。这些方法和技术对于提高图像检索系统的实用性和有效性具有重要意义。