黎曼流形上的半监督深度分析提升视觉分类精度

1 下载量 13 浏览量 更新于2024-08-26 收藏 2.42MB PDF 举报
黎曼流形框架上的半监督判别分析是一种新颖的机器学习方法,旨在解决传统黎曼流形判别分析在处理未标注数据方面的不足。在传统的黎曼流形理论背景下,数据通常被假设分布在一个欧几里得空间,而实际数据可能并不符合这种假设,特别是在视觉分类等复杂任务中。因此,研究者们转向非欧几里得空间,如黎曼流形,以更准确地捕捉数据的内在结构。 本文的主要贡献是提出了一种融合图正则化思想的半监督学习策略。首先,通过将非奇异协方差矩阵转化为黎曼流形上的点,算法利用JBLD(Jensen-Bregman LogDet divergence)度量来衡量黎曼流形上不同点之间的相似性。这一步骤使得算法能够考虑无标签数据的信息,因为它依赖于整个数据集的统计特性,而不仅仅是带标签部分。 接着,数据点被映射到黎曼切空间,这是一种局部平坦的子空间,可以提供数据的向量化表示。这个过程有助于保留数据的局部几何结构,这对于后续的分类至关重要。然后,有标签数据和无标签数据共同构建的邻域图被用来刻画黎曼切空间的局部结构,并作为正则化项加入到费舍尔测地线判别分析的目标函数中,以减少过拟合的风险。 最后,通过优化目标函数,算法能够找到最优的变换矩阵,将数据转换到一个更便于分类的黎曼流形中。这种方法不仅利用了少量带标签数据进行监督指导,还利用了大量无标签数据来增强模型的泛化能力,从而显著提高了分类精度。 实验结果显示,该算法在视觉分类任务中的性能优于传统方法,显示出其在处理半监督学习问题时的有效性和实用性。研究者姜伟、李健芳和杨炳儒分别在他们的领域——机器学习、模式识别、知识发现与智能系统等方面做出了贡献,展示了黎曼流形框架在实际问题中的应用潜力。 黎曼流形框架上的半监督判别分析是一个创新的方法,它利用黎曼几何的特性处理非欧几里得数据,通过结合图正则化和半监督学习,实现了更准确的数据分析和分类。这种方法的出现,对于理解复杂数据集中的模式和关系具有重要意义。