聚类思想下的加权条件熵与属性约简算法

0 下载量 116 浏览量 更新于2024-08-27 收藏 1.05MB PDF 举报
"这篇研究论文探讨了基于聚类思想的加权条件熵及其在属性约简中的应用。文章由范会涛和冯涛撰写,发表于2018年3月的《郑州大学学报(理学版)》第50卷第1期,涉及到的基金项目包括国家自然科学基金和河北省自然科学基金。研究主要集中在粗糙集理论和近似推理,旨在改进属性重要度的确定方法和属性约简算法。 文章首先介绍了粗糙集理论,这是一种在80年代提出的处理不完整和不确定知识的理论,广泛应用于数据挖掘、模式识别和人工智能。随着数据复杂性的增加,经典粗糙集模型的局限性显现,因此学者们提出了新的粗糙集模型,如基于覆盖和非等价关系的模型。 在论文中,作者利用聚类分析来确定信息粒(数据集中的基本单位)与对象的权重。接着,他们结合对象权重与熵理论,定义了一种新的加权条件熵。这个加权条件熵能够更准确地反映数据集中的不确定性关系。基于这个新的熵概念,他们提出了一种改进的属性重要度计算方法和相应的属性约简算法。 属性约简是粗糙集理论中的关键步骤,它旨在找到一个最小的属性子集,这个子集可以保留原始数据集中的决策信息。新算法通过考虑对象权重和加权条件熵,提高了约简的有效性和合理性。为了验证算法的有效性,论文使用了UCI(University of California, Irvine)数据集进行了实验,结果表明新算法在实际应用中具有可行性。 论文关键词包括:相容关系、聚类分析、加权条件熵和约简。这些关键词揭示了研究的核心内容和技术手段。该研究为处理复杂和不确定数据的属性约简提供了一个创新的解决方案,有望在数据分析和决策支持系统等领域产生积极影响。"