非单调邻域粗糙互信息熵驱动的属性约简算法

1 下载量 126 浏览量 更新于2024-08-31 收藏 1MB PDF 举报
属性约简是粗糙集理论在数据挖掘和机器学习领域中的核心应用,它通过减少数据集中的属性数量来提高模型的简洁性和解释性。然而,传统的粗糙集方法在处理连续型数据时,特别是邻域粗糙集模型中,存在一定的局限性,尤其是在属性约简过程中可能无法准确捕捉数据的局部特征和依赖关系。 针对这一问题,本文提出了基于邻域粗糙集的新型模型——邻域粗糙熵模型。这个模型扩展了粗糙集的概念,引入了邻域粗糙联合熵、邻域粗糙条件熵和邻域粗糙互信息熵等新的度量方式。邻域粗糙互信息熵作为一种重要的属性集相关性评估工具,其特点是具有非单调性,即在某些情况下,增加某些属性可能反而会提高系统的复杂性和信息量。 这种非单调性特性对于属性约简来说至关重要,因为它允许算法在寻找最优属性子集时,不仅考虑减少属性的数量,还关注属性之间的相互作用对整体性能的影响。因此,作者提出了一种基于邻域粗糙互信息熵的非单调性属性约简算法。该算法在实验中表现出显著的优势,不仅在属性约简结果上超越了现有的单调性属性约简方法,而且在约简效率上也有所提升。 本文的主要贡献在于开发了一种新的属性约简策略,它利用了邻域粗糙熵的非单调性特性,能够更精确地挖掘数据的内在结构,从而提高模型的性能和效率。这对于数据预处理和特征选择过程具有实际意义,特别是在处理连续型数据集和高维复杂问题时,这种方法有望提供更好的解决方案。