信息熵加权模糊协同聚类:一种改进算法

需积分: 17 4 下载量 152 浏览量 更新于2024-09-08 1 收藏 965KB PDF 举报
"这篇论文提出了一种新的模糊协同聚类算法,通过引入信息熵来优化计算过程,提高协同聚类的效率和准确性。在传统的协同聚类方法中,计算量大是一个显著的问题,而该算法则针对这一问题进行了改进。论文的作者们来自江南大学理学院,他们利用信息熵来衡量数据子集中的不确定性,以此定义相似性距离的权重,进一步通过这些权重实现子集间的协同聚类。这种基于信息熵加权的方法能够更好地利用数据中的相关信息,并且在保持较高计算效率的同时,提高了聚类的精确度。 在新算法的设计中,首先计算出数据的隶属度差异矩阵,这个矩阵反映了各数据点在不同类别间的分布差异。信息熵在这里被用作一个衡量不确定性的工具,它可以帮助识别哪些差异信息更为重要。然后,算法根据信息熵的有效信息量定义了相似性距离的权重系数。这些权重系数不仅考虑了数据之间的相似性,还考虑了数据的不确定性,使得算法在处理大规模数据时能更高效地进行聚类。 实验结果证实了新算法的优势。与传统的协同聚类算法相比,它能自适应地调整协同关系的强度,减少了人工设定参数的复杂性,同时也减轻了协同函数计算的负担。此外,由于信息熵的引入,新算法在处理具有复杂关系的数据时,能够更准确地识别和聚类相关的数据子集。 该研究受到多项基金的资助,包括国家自然科学基金青年基金、高等学校博士学科点专项科研基金和江苏省自然科学青年基金。作者团队由四位研究者组成,他们的主要研究方向涵盖了模式识别、生物信息学、计算机图形学以及数值计算等领域,这为他们开发出这种创新的协同聚类算法提供了坚实的理论基础和技术支持。 关键词:模糊聚类、协同关系、差异矩阵、信息熵、权重系数。这些关键词表明了论文的核心内容,涉及了数据挖掘、机器学习和数据聚类等多个关键领域。" 这篇论文的发表和修订时间并未提供,但可以推断,它是对当前协同聚类算法的一次重要改进,对于数据科学、机器学习和信息处理领域的研究者来说,这种信息熵加权的协同聚类方法具有重要的参考价值。