最小信息熵值聚类:一种相似矩阵构造方法

需积分: 26 1 下载量 25 浏览量 更新于2024-08-11 收藏 216KB PDF 举报
"这篇论文是2012年发表在《湖南科技大学学报(自然科学版)》第27卷第3期的科研成果,作者魏书堤探讨了基于最小熵值的相似矩阵构造方法及其在聚类分析中的应用。文章主要关注如何在多准则决策的模糊问题中,通过信息熵来确定属性权重,并构建有效的相似矩阵,从而实现更合理的聚类过程。" 在聚类分析中,相似矩阵扮演着至关重要的角色,因为它决定了不同对象之间的相似度。论文首先定义了相似矩阵及其基本性质,同时概述了一些常见的构造方法。然而,这些传统方法往往忽视了不同属性的重要性差异,即权重信息。针对这一问题,作者提出了一种创新方法,该方法基于最小信息熵值原则。 最小信息熵值原理用于获取多准则决策中的属性权重。在处理模糊问题时,这种原理尤其有用,因为它能够量化不确定性并提取关键信息。魏书堤的方法首先计算各个属性的加权距离,这涉及到对不同方案集之间的距离进行加权计算。接着,通过构建正负理想解,可以衡量每个方案集与理想解之间的距离。理想解是根据所有属性的最佳和最差情况设定的基准。然后,通过比较方案之间的加权距离与它们与理想解的整体距离比例,构建出相似矩阵。 论文中通过实例证明了这种方法的有效性。实例分析显示,利用最小信息熵值构建的相似矩阵能够在模糊环境中提供更加准确和有意义的聚类结果。这种方法不仅考虑了属性权重,还引入了模糊理论,使得聚类过程更加适应复杂的数据环境。 此外,论文还引用了其他相关研究,如利用支持向量机(SVM)进行聚类和遗传算法实现聚类分析,以及模糊聚类方法的扩展,这些都为理解相似矩阵构造提供了背景。论文最后指出,该方法可以进一步应用于多准则模糊聚类分析,以改进现有的分类技术。 这篇论文提供了一种新颖的相似矩阵构造策略,它在处理模糊问题和多准则决策时能更好地捕捉数据的内在结构,提高了聚类分析的精确性和实用性。这一方法对于从事数据挖掘、机器学习和统计分析的科研人员具有重要的参考价值。