高光谱图像半监督分类:K均值聚类与孪生支持向量机结合

需积分: 10 2 下载量 64 浏览量 更新于2024-09-07 1 收藏 656KB PDF 举报
"高光谱图像;半监督分类;机器学习;孪生支持向量机;K均值聚类算法;样本缩减;分类精度" 在高光谱成像领域,由于数据具有高维度和波段间的强相关性,使得获取大量标签信息变得耗时且困难。半监督分类作为一种基于传统机器学习的策略,可以有效地应对这一挑战。它利用少量已标注的监督信息和大量的无监督数据来执行分类任务,降低了对大量标签样本的依赖。 本文提出了一种结合K均值聚类和孪生支持向量机(Twin Support Vector Machine, TSVM)的半监督分类方法,旨在提高分类效率。TSVM因其高精度而被广泛认可,但其计算复杂度高,分类时间较长。而K均值聚类则以其快速迭代和快速收敛的特性著称。通过预先应用K均值聚类对高光谱图像进行预处理,可以有效减少样本数量,进而降低TSVM分类时的计算负担,缩短计算时间,整体上优化了分类流程的时间效率。 具体来说,该方法首先使用K均值聚类对高光谱图像进行无监督预处理,将高维数据聚类为若干个簇。然后,选取每个簇的中心或代表性样本作为TSVM的训练样本,以减少样本量。由于这些样本是聚类结果的代表,它们在一定程度上保留了原始数据的信息,因此能在保持分类精度的同时,显著降低TSVM的计算复杂度。 实验表明,这种结合策略能够在不牺牲分类精度的情况下,大幅减少TSVM的运行时间,提高了分类效率。这种方法对于处理大规模高光谱数据集尤其有利,因为它减少了对大量手动标注样本的需求,同时保持了分类的准确性和速度。 关键词中的“高光谱图像”是指包含多个连续光谱波段的图像,用于提供丰富的光谱信息。“半监督分类”是一种机器学习策略,利用有限的标记数据和大量的未标记数据进行学习。“机器学习”是让计算机通过经验自动改进算法的过程。“孪生支持向量机”是一种支持向量机变体,适用于高效分类。“K均值聚类算法”是一种常用的无监督学习算法,用于将数据分为固定数量的类别。“样本缩减”是指减少训练模型所需的数据量,以提高计算效率。“分类精度”衡量的是分类模型正确预测的比例。 这篇研究论文探讨了一种创新的高光谱图像分类策略,通过融合K均值聚类和TSVM的优势,解决了高光谱图像分类中的时间和计算资源限制问题,提升了分类效率。