基于DFSSVM的特征选择算法研究
需积分: 45 181 浏览量
更新于2024-07-18
2
收藏 1.09MB PDF 举报
"DES算法是特征选择的一种方法,旨在解决CES算法在处理连续函数时的局限性。DES算法考虑了特征间的相关性,通过衡量特征子集的区分度(DFS)来评估其对分类的贡献,从而进行特征选择。在DES中,特征子集的区分度是基于所有特征对分类的联合贡献来计算的,而不仅仅是单个特征的贡献。该算法结合了四种特征搜索策略:顺序前向、顺序后向、顺序前向浮动和顺序后向浮动,并利用支持向量机(SVM)作为分类器来指导特征选择过程,最终生成四种基于DFS和SVM的特征选择算法。在顺序前/后向浮动搜索策略中,DFS准则被用于动态增减特征,优化特征子集,提高分类性能。这项工作由谢娟英和谢维信等人进行,得到了国家自然科学基金等多个项目的资助,并发表于《计算机学报》上。"
DES算法(Discrimination of Feature Subsets)是一种特征选择的扩展算法,针对CES(Characteristic Evaluation Strategy)算法在处理包含连续函数数据时的不足。DES的主要目标是衡量特征子集的整体分类能力,而不只是关注单个特征的表现。它引入了一个新的度量标准——DFS(Discernibility of Feature Subsets),该标准考虑了特征间的相互关系,通过计算特征子集中的所有特征对分类任务的联合贡献来评估子集的区分度。
特征选择在机器学习和数据挖掘中至关重要,因为它可以降低模型复杂性,减少过拟合的风险,同时提高预测准确性和模型解释性。DES算法通过综合考虑特征的相关性,有助于筛选出对分类任务最具影响力的特征子集,从而提升支持向量机(SVM)等分类器的性能。
在DES的实现过程中,结合了四种不同的特征搜索策略:
1. 顺序前向:从空集开始,逐步添加特征,每次添加一个最能提高分类性能的特征。
2. 顺序后向:从全特征集开始,逐步删除特征,每次删除对分类影响最小的特征。
3. 顺序前向浮动:类似于顺序前向,但在添加特征后会检查已选择的特征子集,如果替换一个已有的特征可以提高性能,则进行替换。
4. 顺序后向浮动:类似于顺序后向,但在删除特征后会检查是否可以添加回一个已删除的特征以提升性能。
这些搜索策略都是基于DFS准则来确定特征的添加或删除,以此构建最优特征子集。支持向量机(SVM)作为强大的分类工具,在这个过程中起到关键作用,通过SVM的分类性能来反馈特征子集的选择效果。
谢娟英和谢维信的研究工作不仅提出了DES算法,还将其与SVM结合,形成了四种具体的特征选择算法,这对于处理复杂数据集和提高分类模型的性能具有实际应用价值。这项研究受到多个科研项目的资助,表明了其在学术界和工业界的重要地位。
2019-09-09 上传
2016-04-14 上传
2021-02-05 上传
中科院大学网安学院五班
- 粉丝: 336
- 资源: 1
最新资源
- 单片机串口通信仿真与代码实现详解
- LVGL GUI-Guider工具:设计并仿真LVGL界面
- Unity3D魔幻风格游戏UI界面与按钮图标素材详解
- MFC VC++实现串口温度数据显示源代码分析
- JEE培训项目:jee-todolist深度解析
- 74LS138译码器在单片机应用中的实现方法
- Android平台的动物象棋游戏应用开发
- C++系统测试项目:毕业设计与课程实践指南
- WZYAVPlayer:一个适用于iOS的视频播放控件
- ASP实现校园学生信息在线管理系统设计与实践
- 使用node-webkit和AngularJS打造跨平台桌面应用
- C#实现递归绘制圆形的探索
- C++语言项目开发:烟花效果动画实现
- 高效子网掩码计算器:网络工具中的必备应用
- 用Django构建个人博客网站的学习之旅
- SpringBoot微服务搭建与Spring Cloud实践