马忠臣、陈松灿:多维分类的距离度量学习新方法

需积分: 5 1 下载量 182 浏览量 更新于2024-07-17 收藏 378KB PDF 举报
本文主要探讨了"一种面向多维分类问题的距离度量方法",由马忠臣和陈松灿两位作者在南京航空航天大学计算机科学与技术学院完成。多维分类(MDC)相较于传统的多标签分类(MLC),具有更高的复杂性,因为它涉及到个体输入样本与多维离散输出变量之间的关系,这些输出维度可能具有不同的范围,并且对应着异构的语义结构,这就需要更为灵活且高效的处理方式。 研究的核心目标是解决MDC中的有效学习问题,关键在于如何充分利用输入样本间的维间和维内的关系。作者提出了一种创新的输出空间转换方法,它具有以下优点:首先,这种转换使得后续的学习在转化后的空间中变得更加直观和简单;其次,它能够体现明显的维内关系,有助于捕捉输出变量间的内在联系;此外,这种方法保持了原始输出空间的大小不变,避免了不必要的维度膨胀;同时,还克服了现有MDC转换方法的一些不足;最后,对于每个输出维度,它具有可分解性,便于进一步处理。 为了有效地处理转化后的问题,文章引入了一种新颖的马氏距离度量学习方法。这种方法的一个显著特点是能获得闭合解,这意味着计算过程中不会陷入局部最优,而是能找到全局最优的解决方案,这在理论和实践中都具有重要意义。马氏距离度量学习不仅适用于MDC,其本身的理论价值和通用性也值得深入研究。 通过大量的实验验证,作者证明了他们的方法在多数情况下能够超越现有的MDC最佳算法,在多维分类任务中展现出优越的性能。同时,即使在处理多标签分类数据集时,他们的距离度量学习方法也能展现出与专门设计的MLC方法相当的竞争优势。这篇论文对多维分类问题的度量学习提供了创新性的解决方案,为该领域的研究者提供了有价值的技术参考和理论支持。