基于核空间类间距离的RBF-SVM特征选择算法优化

需积分: 14 2 下载量 135 浏览量 更新于2024-09-07 收藏 1.35MB PDF 举报
本文研究了一种新型的特征选择算法,即基于核空间类间平均距的径向基函数—支持向量机(RBF-SVM)特征选择方法。传统的SVM-RFE算法在特征选择过程中表现出较高的算法复杂度,这导致了特征选择过程的时间消耗较长,对于大规模数据集来说,这一问题尤为突出。为了优化这一问题,研究人员首先探讨了径向基函数(RBF)核参数与数据集在核空间中的类间平均距离之间的关系,这是决定支持向量机分类性能的关键因素之一。 算法的核心思想是通过计算每个特征对数据集核空间类间平均距离的影响来评估其重要性。相比于传统的基于系数或者递归特征消除(RFE)的方法,这种新方法更加直接地反映了特征对分类任务的实际贡献。通过对单个特征的这种贡献进行量化,算法能够更有效地进行特征排序,从而选择出对分类性能影响最大的特征子集。 在实验部分,研究者将这个新的RBF-SVM特征选择算法与SVM-RFE算法应用于八个来自UCI机器学习数据集的比较实验。实验结果显示,新算法不仅在保持较高分类准确性的前提下,显著降低了特征选择所需的时间,证明了其在实际应用中的高效性和有效性。这对于在大型数据集中进行特征选择任务的机器学习实践具有重要的意义,能够节省大量的计算资源,提高模型构建的速度。 总结来说,这篇论文提出了一种创新的特征选择策略,它结合了RBF核函数的优势和对核空间类间平均距离的利用,有效解决了SVM-RFE算法在特征选择上的效率问题。这种方法为改进支持向量机在实际应用中的性能提供了一个实用的工具,特别是在那些对计算效率有严格要求的场景下。