基于ReliefF和PLS的特征选择算法提升分类精度

需积分: 35 6 下载量 120 浏览量 更新于2024-09-06 收藏 632KB PDF 举报
本篇论文主要探讨了"一种基于ReliefF和PLS的特征选择算法",由作者邹常盼和亓峰合作完成,他们分别来自北京邮电大学网络与交换技术国家重点实验室。论文旨在解决PLS算法在实际应用中遇到的一个关键问题,即冗余特征可能导致分类精度下降。PLS,即偏最小二乘法,是一种广泛用于回归分析和机器学习中的工具,但其对特征选择的敏感性是一个挑战。 文章的核心思想是提出一种融合了ReliefF算法和PLS的方法来改善特征选择过程。ReliefF算法是一种无监督的特征选择方法,它通过评估每个特征在样本分类中的局部重要性来剔除冗余特征。通过先用ReliefF算法筛选出关键特征,然后利用PLS进一步提取这些特征中的核心部分,形成一个有效的特征子集,实现了特征维度的降低。这种方法不仅能够提高分类精度,还有助于减少计算复杂度,因为较少的特征意味着更低的时间复杂度。 实验部分,作者选择了UCI数据集进行分类性能的比较,结果显示,结合ReliefF和PLS的特征选择算法在保持较高分类精度的同时,还能显著缩短分类时间,证明了这一新型算法的有效性和实用性。这对于信息特征压缩和模式识别领域的研究具有重要意义,因为它提供了一种高效且精确的特征选择策略,适用于各种机器学习模型,如支持向量机(SVM)等。 总结来说,这篇论文主要贡献在于提出了一种创新的特征选择方法,通过结合ReliefF的局部重要性评估和PLS的主成分分析,有效地解决了特征冗余对PLS算法性能的影响。这种技术对于提升分类任务的效率和准确性,特别是在大数据背景下,有着重要的理论价值和实践意义。