分级混合聚类法:自组织神经网络与熵优化

需积分: 5 0 下载量 89 浏览量 更新于2024-08-12 收藏 220KB PDF 举报
"一种新的分级混合聚类法 (2003年),马宝萍,南京师范大学控制科学与工程系" 在模式识别领域,聚类分析是一项基础且重要的任务,用于将数据集中的对象根据其相似性进行分组。传统的聚类方法如系统聚类法、模糊聚类法(如FCM、PCM算法)和自组织特征映射(SOM)各有优缺点。其中,模糊聚类算法虽然能够处理不确定性,但需要预先设定分类数量,这在实际应用中往往难以确定,且对初始条件敏感,容易陷入局部最优。 针对模糊聚类算法的这些问题,论文提出了一种新的分级混合聚类法(Hierarchical Hybrid Clustering Method, HHCM)。这种方法结合了自组织神经网络(Kohonen SOM)和基于熵的聚类算法,旨在提高聚类效率和保证聚类结果的有效性。首先,SOM用于对原始数据进行特征提取,减少数据维度并提取关键信息,然后基于熵的聚类算法对简化后的数据进行聚类,无需预设类别数目,降低了计算复杂度。 传统的模糊聚类算法如FCM(Fuzzy C-Means)和PCM(Partitioning Around Medoids)在优化过程中可能会遭遇局部最优问题,影响聚类质量。文献中提到的方法,如将Kohonen SOM与FCM结合,虽然可以提升算法速度,但仍然无法完全避免陷入局部极小值。另一方面,基于熵的聚类方法虽然不需要预设类别,但其有效性检验缺乏直接标准,可能导致非最优的聚类结果。 HHCM算法的独特之处在于其分级和混合的特性。分级体现在算法分为两个阶段,第一阶段通过SOM进行预处理,第二阶段使用熵为基础的聚类,降低了对初始条件的依赖。混合则体现在结合了监督学习(SOM)和无监督学习(熵聚类)的策略,提升了整体聚类性能。此外,由于它无需预设类别数,所以更具灵活性,适应性强。 通过实例,论文展示了HHCM算法在实际应用中的良好表现,能够有效地避免陷入局部极小值,提高了聚类速度,降低了计算复杂度,同时也保证了聚类的有效性。这种方法对于那些对计算效率有高要求且类别数目不明确的数据集来说,提供了一种有效的解决方案。 HHCM是一种创新的聚类方法,它融合了神经网络与熵理论,克服了传统模糊聚类算法的部分局限性,为大数据环境下的高效聚类分析提供了新的思路。