集成CFS与NMI-PSO的癌症识别特征选择方法

0 下载量 58 浏览量 更新于2024-08-27 收藏 187KB PDF 举报
本文探讨了一种针对癌症识别的集成特征选择技术,标题为"An Ensemble Feature Selection Technique for Cancer Recognition"。该研究由Jiucheng Xu、Lin Sun、Yunpeng Gao和Tianhe Xu四位作者共同完成,他们分别来自河南师范大学计算机与信息工程学院以及河南省计算智能与数据挖掘工程技术研究中心。文章的核心内容聚焦于将邻域互信息(Neighborhood Mutual Information, NMI)和粒子群优化(Particle Swarm Optimization, PSO)相结合,形成一种高效的基因选择算法,称为NMICFS-PSO。 NMI是一种衡量特征之间相关性的方法,而PSO则作为一种优化算法,用于寻找最优解。通过集成这两种技术,研究人员旨在减少癌症识别任务中的冗余特征,并提高模型的性能。实验部分,作者们聚集了多个癌症识别任务,利用支持向量机(Support Vector Machine, SVM)作为分类器,并结合交叉验证策略进行评估。结果显示,与现有的其他方法相比,NMICFS-PSO在六项基于基因表达的数据集上表现出优越的分类准确性。这意味着该方法不仅能够有效地剔除不重要的特征,而且在实际应用中能显著提升癌症诊断的精度,对于癌症研究领域具有重要的实践价值。这篇研究论文提供了一种有效且实用的特征选择策略,对癌症识别的准确性和效率有显著提升。