自适应聚类算法的聚类有效评估指标研究

3 下载量 105 浏览量 更新于2024-08-26 收藏 377KB PDF 举报
"自适应聚类算法的聚类有效性指标" 这篇研究论文发表在IET Communications期刊上,由Hongyan Cui、Mingzhi Xie、Yunlong Cai、Xu Huang和Yunjie Liu共同撰写。文章的发表日期为2013年10月15日,经过修订后于2014年3月19日被接受,并在2014年4月11日正式发布,DOI为10.1049/iet-com.2013.0899,ISSN号为1751-8628。 论文主要探讨了自适应聚类算法的聚类有效性指标。聚类是一种无监督学习方法,用于将数据集中的对象按照其相似性或距离关系分组,形成不同的簇。在实际应用中,特别是互联网数据分析中,如流量特征的作者数据库,经常会遇到未知的聚类结构问题,例如簇边界的模糊性和簇分区的不确定性。 自适应聚类算法旨在根据数据本身的特性动态调整聚类过程,以提高聚类的质量和准确性。然而,评估这些算法的性能和聚类结果的有效性是一个挑战。传统的聚类有效性指标,如轮廓系数、Calinski-Harabasz指数和Davies-Bouldin指数,可能无法充分反映自适应聚类算法的动态特性。 论文中,作者可能提出了新的聚类有效性指标或改进现有指标的方法,以更有效地评价自适应聚类算法的性能。这些指标可能考虑了簇的紧凑度、分离度以及算法在处理模糊边界和不规则数据分布时的适应性。通过这种方式,研究可以帮助优化聚类算法,使其在面临复杂、动态变化的数据环境时能够提供更准确的聚类结果。 此外,由于作者来自北京邮电大学国家重点实验室、华为技术有限公司通信实验室以及澳大利亚堪培拉大学,可以推测这项研究结合了理论研究与工业实践,可能有实际的应用背景和价值,如网络流量监控、用户行为分析等场景。 总结来说,这篇论文关注的是如何在自适应聚类算法中建立有效的评估标准,以应对模糊的簇边界和不确定的聚类结构问题,对于理解和改进这类算法的性能具有重要意义。