SLEM:基于稀疏标签编码的多维分类新方法

需积分: 14 0 下载量 192 浏览量 更新于2024-08-05 收藏 443KB PDF 举报
"这篇论文是ICML2021上发表的,名为‘基于稀疏标签编码的多维分类’,作者是Bin-Bin Jia和Min-Ling Zhang。研究主要集中在多维分类(MDC)问题上,该问题涉及多个类变量,每个变量对应一个异构类空间。传统方法在处理这类问题时面临的挑战在于如何处理不同类变量间的依赖关系。" 正文: 在多维分类任务中,输出空间通常包含多个类变量,这些变量可能属于不同的类别结构,这使得建模和预测变得复杂。传统的分类方法在处理这样的异构数据时可能会遇到困难,因为它们难以捕捉类变量之间的相互作用。这篇论文介绍了一种名为SLEM(Sparse Label Encoding)的新方法,它创新性地将预测模型的学习从原始的异构标签空间转移到经过编码的标签空间。 SLEM的核心是一个编码-训练-解码框架。首先,在编码阶段,SLEM运用三个连续的操作来转换类向量:1) 对对分组,这有助于发现和处理类变量之间的关联;2) 一次热转换,将离散的类标签转化为连续的表示,便于后续处理;3) 稀疏线性编码,进一步压缩并减少冗余,使编码后的向量更加简洁。 接下来,在训练阶段,SLEM在经过编码的标签空间中学习一个多输出回归模型。相比于传统的分类模型,多输出回归模型可以更好地处理连续的、编码后的标签,同时考虑到所有类变量的整体效应。 最后,解码阶段使用正交匹配追踪(Orthogonal Matching Pursuit, OMP)算法来从学习到的多输出回归模型的输出中恢复预测的类向量。OMP是一种有效的稀疏信号恢复技术,它能从编码后的连续向量中找到与原始类向量最匹配的解。 实验结果显示,SLEM在处理多维分类问题时,相较于现有的先进方法,表现出显著的优越性能。这表明,通过SLEM的编码策略,能够更有效地捕获和利用类变量之间的依赖信息,从而提高多维分类的准确性和效率。 SLEM提供了一个强大的工具来解决多维分类问题,特别是当类空间具有异质性时。它通过编码标签空间,使得建模和学习过程更加高效,并且通过实验验证了这种方法的有效性。这种创新的方法对于推动多维分类领域的研究和技术发展具有重要意义。