融合子空间学习的图稀疏属性选择算法

需积分: 9 0 下载量 103 浏览量 更新于2024-09-07 收藏 2.8MB PDF 举报
"这篇论文提出了一种新的属性选择方法,结合了子空间学习中的线性判别分析(LDA)和局部保持投影(LPP),用于大数据属性约简。研究指出,属性选择和子空间学习各有优势,前者具有良好的解释性,后者在分类效果上更优。因此,该算法旨在融合这两种方法,通过考虑数据的全局和局部特性,并引入稀疏正则化因子,以提高属性选择的效果。实验结果表明,新算法在分类准确率、方差和变异系数等评价指标上表现出色,能够更有效地选取具有判别能力的属性,且分类性能良好。该研究得到了多项国家自然科学基金和科研项目的资助,由广西地区的多位学者共同完成。" 这篇论文关注的是如何高效处理高维度属性的大数据问题,特别是属性约简。属性约简是数据预处理的关键步骤,它有助于减少数据复杂性,提高后续分析和建模的效率。通常,属性约简有两种主要方法:属性选择和子空间学习。属性选择直接根据某些准则(如信息增益、卡方统计量等)来选择最相关的属性,其优点在于易于理解和解释。另一方面,子空间学习则通过寻找一个低维子空间,在这个子空间中数据的分类性能最佳。 论文中提出的新算法将两者结合,采用了子空间学习的两种技术——线性判别分析(LDA)和局部保持投影(LPP)。LDA是一种经典的降维方法,它旨在找到一个线性变换,使类间距离最大化,类内距离最小化,从而增强分类性能。LPP则是一种非线性的降维方法,它试图保持数据的局部结构,对于处理非线性问题尤为有效。通过将这两者结合,新算法能够在保持数据的全局和局部特性的同时,引入稀疏性约束,进一步优化属性选择过程。 实验部分,研究人员使用了分类准确率、方差和变异系数等指标评估新算法的性能。这些指标可以全面地衡量算法在保留关键信息和提升分类效果方面的表现。结果显示,新算法在这些评价指标上超越了其他算法,证明了它的有效性和实用性。 这项研究不仅为大数据属性约简提供了一个新的解决方案,还对机器学习和数据挖掘领域的理论研究与实践应用都具有重要的参考价值。它展示了在处理复杂数据时,如何通过融合不同的方法来达到更好的性能,同时也强调了在属性约简过程中考虑数据全局和局部特性的重要性。