2011年:基于CO-occurrence的高效聚类集成方法:识别数据细微结构

需积分: 50 2 下载量 51 浏览量 更新于2024-08-12 收藏 483KB PDF 举报
本文主要探讨了一种创新的基于属性值的共现相似度(Co-occurrence Similarity)在聚类集成方法中的应用,发表于2011年的《计算机应用》杂志,作者是凌光、王明春和冯嘉毅,来自天津职业技术师范大学理学院。论文的创新之处在于: 1. 概念引入与定义:首先,作者提出了一种严格的数学定义,用于衡量类别属性值之间的共现相似度。这种定义强调了属性值之间的关联性和频次,是衡量它们共同出现的概率或频率的一种量化方式。 2. 等价性表述:随后,作者进一步扩展了这一概念,提供了三种等价的定义,确保了相似度量的一致性和有效性。这些等价性表述增强了理论的严谨性,使得不同情况下的共现相似度计算更加准确。 3. 数据对象间的相似度计算:论文深入探讨了如何将属性值间的共现相似度推广到数据对象层面。通过这种方法,不仅考虑了单个聚类内的对象间关系,还考虑到各个初始聚类结果之间的相互影响和联系,从而提供了一个更为全面的相似度评估框架。 4. 聚类集成方法:基于共现相似度的聚类集成(CSCE)方法被设计并应用于实际问题中。这种方法能够有效地识别数据对象之间的细微结构,这对于提高聚类集成的性能至关重要。相比于传统的方法,CSCE方法能够更好地捕捉数据集中的复杂模式,提高了聚类的精确性和稳定性。 5. 实验验证:论文通过实验展示了CSCE方法的有效性。实验结果表明,这种方法在处理具有多变性和复杂性的数据集时,能显著提升聚类集成的效率和准确性,从而在实际应用中展现出良好的性能。 这篇论文在理论和实践层面上都对聚类集成技术进行了有益的拓展,特别是在处理多源、高维数据集时,共现相似度提供了新的分析视角和解决方案。通过这种方法,研究者可以更深入地理解和挖掘数据内在的结构,提升聚类分析的精度和实用性。