改进粒子群与SVM混合特征变换提升数据挖掘精度

需积分: 19 0 下载量 10 浏览量 更新于2024-09-08 收藏 372KB PDF 举报
本文档深入探讨了"改进粒子群与支持向量机混合的特征变换"这一主题,发表于2009年12月的《北京邮电大学学报》第32卷第6期。作者熊文和王枞针对数据挖掘中的特征预处理问题,提出了一种创新方法来提升支持向量机(SVM)的分类精度。他们首先利用推广t统计、Fisher判别式和随机森林的线性加权度量对特征进行排序,以确定一个预选特征子集。这种方法的关键在于改进的粒子群优化(PSO)技术,通过引入启发式信息来加速搜索特征的线性变换因子。 在特征变换阶段,二进制PSO被用来进行特征选择,这有助于减少冗余信息并增强模型的可解释性。接下来,通过格子搜索技术,作者们在后处理阶段优化了特征变换后的模型,最终目的是构建出具有高精度的SVM分类器。对比实验显示,这种混合方法在NIPS2003的madelon数据集以及10个UCI数据集中,与传统的C-SVM相比,其分类精度在4个数据集上取得了显著提升。 该研究的重要贡献在于将粒子群优化算法与支持向量机的有效性相结合,不仅提升了模型性能,还可能为特征工程和机器学习领域提供新的思路。对于那些关注数据预处理、特征选择和深度优化方法的读者来说,这篇论文提供了有价值的研究案例和技术细节,对于使用Matlab等工具进行类似研究或实际应用具有参考价值。关键词包括粒子群、特征变换、支持向量机、特征选择以及分类,这些术语共同构成了该论文的核心内容和研究焦点。