数值型数据下的邻域决策分辨率特征选择算法

需积分: 9 0 下载量 183 浏览量 更新于2024-08-12 收藏 539KB PDF 举报
本文档主要探讨了"采用邻域决策分辨率的特征选择算法"这一主题,针对粗糙集模型在处理数值型数据时存在的问题——即在将其离散化的过程中,容易导致决策信息的丢失。作者诸文智、司刚全和张彦斌在西安交通大学电气工程学院的研究背景下,提出了一个创新的解决方案。他们提出的算法不再局限于单一的离散处理,而是引入了邻域决策分辨率(Nc)的概念。 邻域决策确定性(Nc)是算法的核心组成部分,它用来衡量每个信息粒(数据单元)在邻域范围内的决策分布与其分类能力之间的关系。通过这种度量,算法能够评估单个信息粒对决策区分度的贡献,从而避免了离散化带来的信息损失。此外,作者还定义了邻域决策分辨率,这是一个综合所有特征向量空间上的信息粒的Nc值的指标,用于评价特征子集的整体决策可分辨性,实现了对名义型和数值型数据的统一处理。 论文的关键点在于其有效性:通过仿真实验和实际应用的验证,结果表明,这种基于邻域决策分辨率的特征选择算法在性能上优于当前主流的基于邻域粗糙集的特征选择方法。这意味着它在保持决策精度的同时,能够更好地保留原始数据的连续性,从而提高特征选择的准确性和效率。 总结起来,这项研究对于改进特征选择算法在处理混合类型数据(包括数值型和名义型)时的性能具有重要意义,为数据挖掘和机器学习领域的特征工程提供了一个新的思考角度和实用工具。它不仅解决了传统方法的局限性,而且展示了在实际问题中的潜在价值,对提升数据驱动的决策支持系统具有积极的推动作用。