粗糙集属性贴近度聚类方法及其实例分析

需积分: 5 0 下载量 103 浏览量 更新于2024-08-11 收藏 476KB PDF 举报
"基于粗糙集属性贴近度的聚类方法与应用 (2012年)",这篇2012年发表在《辽宁工业大学学报(自然科学版)》的研究论文,探讨了如何利用基于粗糙集理论的对象属性贴近度来解决信息表中定性与定量属性值共存时的聚类问题。作者申立平和王艳平提出了一种模糊聚类方法,通过定义对象的属性贴近度公式,构建模糊矩阵,并进一步阐述了聚类算法。 在信息技术和数据分析领域,聚类是一种无监督学习方法,用于将数据集中的对象分组,使得同一组内的对象相互之间具有高相似性,而不同组之间的对象相似性较低。当处理的数据既有定性(如类别、性别等)又有定量(如数值、长度等)属性时,传统的聚类方法可能遇到挑战。粗糙集理论,源于波兰科学家Zdzisław Pawlak的概念,是一种处理不完全或模糊信息的有效工具,它能够识别和处理不确定性和不精确性。 在该论文中,作者首先给出了对象属性贴近度的公式,这是一个衡量两个对象在特定属性上的相似程度的指标。这个公式可能是基于属性值的某种距离度量,如欧氏距离、曼哈顿距离或切比雪夫距离,也可能涉及到对定性属性的模糊逻辑处理。通过这个公式,可以计算出信息表中每个对象与其他对象的相似度,从而形成一个模糊矩阵。 模糊矩阵是将对象之间的相似度表示为模糊关系的一种方式,其中元素的值介于0到1之间,1表示完全相似,0表示完全不同。利用模糊矩阵,可以进行进一步的模糊运算,如传递闭包,以确定对象之间的关联强度。传递闭包操作有助于揭示潜在的聚类结构,因为它考虑了对象之间的间接相似性,而不仅仅是直接相似性。 论文提出的聚类方法可能包括以下步骤: 1. 计算所有对象之间的属性贴近度,形成模糊矩阵。 2. 应用模糊运算,如模糊C均值(FCM)或其他模糊聚类算法,基于模糊矩阵进行聚类。 3. 通过迭代优化聚类中心,使得同一类别的对象间相似度最大化,不同类别间的相似度最小化。 4. 使用传递闭包分析,改进聚类结果,确保聚类的稳定性和连通性。 最后,作者通过一个实际例子展示了这种方法的应用,证明了其在处理混合属性类型数据聚类问题时的有效性。这种方法对于处理包含定性与定量属性的数据集,特别是在数据挖掘、模式识别、决策支持等领域具有重要的实践价值。 "基于粗糙集属性贴近度的聚类方法与应用"提供了一种新的处理混合属性数据的聚类策略,通过融合粗糙集理论和模糊逻辑,解决了传统方法的局限性,为复杂数据集的分析提供了有力工具。