低秩超图属性选择:基于属性自表达的高效算法

需积分: 9 1 下载量 4 浏览量 更新于2024-09-07 1 收藏 1.43MB PDF 举报
本篇论文研究关注于高维数据处理中的一个重要问题,即如何有效剔除冗余属性并选取最具代表性的特征,以提高数据处理和分析的效率。论文提出了一个名为“基于属性自表达的低秩超图属性选择算法”。该算法的核心思想是结合属性自表达和低秩表示,以及超图的正则化机制。 首先,属性自表达这一特性被利用来构建模型,通过其他属性的稀疏表示,将每个属性转换为一种低秩形式。这种转换基于低秩假设,即高维数据在某些维度上可能存在线性依赖或结构,这有助于发现数据的潜在结构和关键信息。低秩表示不仅考虑了数据的整体趋势(全局信息),也体现了数据的内在子空间结构。 其次,超图正则化因子的引入是为了保持数据的局部结构,确保在选择属性过程中不会丢失重要的局部联系。这种正则化手段使得算法能够在全局和局部信息之间找到平衡,能够更好地捕捉数据的复杂性和多样性。 最后,通过稀疏正则化,算法可以筛选出那些既具有全局影响力又保持局部关联性的属性,实现有效的属性选择。这种方法实质上是一种嵌入了子空间学习的属性选择策略,它旨在通过综合考虑全局和局部信息,提高特征选择的准确性和有效性。 实验部分展示了该算法相较于传统属性选择算法的优势,它在选取属性的同时,能够显著提升分类任务的性能。作者团队由多位研究数据挖掘和机器学习的学者组成,包括苏毅娟、雷聪、胡荣耀、何威和朱永华,他们分别来自广西师范学院、广西师范大学和广西大学的研究机构,他们的贡献证明了该算法在实际应用中的价值。 这篇论文提出了一种新颖的无监督属性选择方法,其在处理高维数据时展现出强大的性能和实用性,对于提升数据分析和挖掘的精度具有重要意义。