二阶局部四角模式与颜色特征结合的图像检索系统

0 下载量 2 浏览量 更新于2024-06-17 收藏 3.6MB PDF 举报
"本文主要探讨了一种基于二阶局部四角模式(LTAP)和颜色特征的图像检索系统,旨在解决大规模图像集合中基于内容的图像检索问题。研究者提出的新LTAP方法增强了纹理特征的捕获能力,并通过与RGB颜色特征结合形成混合特征向量,进一步提升了检索性能。遗传算法被用来优化特征选择,支持向量机(SVM)与卡方二次距离度量用于图像分类和相似性比较。实验在Corel1k、Oxfordflower和CIFAR-10数据集上验证了该系统的有效性。" 在当前的信息时代,社交媒体平台的爆炸式增长和数字捕获设备的普及导致了大量的图像数据产生。为了从这些海量图像中检索出相关信息,基于内容的图像检索(CBIR)技术变得至关重要。CBIR的核心是设计能够准确描述图像特征的描述符,以便缩小语义差距,找到与查询图像最匹配的结果。 本文提出了一种新的二阶局部四角模式(LTAPs)作为纹理特征描述符。LTAPs通过计算0°、45°、90°和135°方向的相邻像素的二阶导数来捕获图像纹理信息,从而更全面地反映图像的细节。此外,为了融合颜色信息,研究者将LTAPs与RGB颜色特征相结合,构建了一个混合特征向量。利用遗传算法,可以从这个特征向量中选择最优子集,以提升图像检索的性能。 在分类和检索过程中,文章采用了支持向量机(SVM),这是一种常用的机器学习模型,特别适用于小样本和高维数据。通过GA优化的SVM可以更好地拟合数据,提高分类准确性。同时,使用卡方二次距离作为相似性度量,来评估查询图像与数据库图像之间的相似程度。 实验结果在Corel1k(一个中等规模的图像数据集)、Oxfordflower(花卉识别数据集)和CIFAR-10(包含10个类别的小型图像数据集)上进行,验证了新方法的有效性。这些跨领域的数据集测试了模型在不同场景和主题下的泛化能力。 这项工作为CBIR提供了一个创新的解决方案,通过结合改进的纹理特征和颜色特征,以及智能的特征选择和分类策略,提高了检索的精度和效率。这种方法对于处理社交媒体等平台上的大量图像数据具有实际应用价值。