分级混合聚类法:自组织神经网络与熵优化
需积分: 5 89 浏览量
更新于2024-08-12
收藏 220KB PDF 举报
"一种新的分级混合聚类法 (2003年),马宝萍,南京师范大学控制科学与工程系"
在模式识别领域,聚类分析是一项基础且重要的任务,用于将数据集中的对象根据其相似性进行分组。传统的聚类方法如系统聚类法、模糊聚类法(如FCM、PCM算法)和自组织特征映射(SOM)各有优缺点。其中,模糊聚类算法虽然能够处理不确定性,但需要预先设定分类数量,这在实际应用中往往难以确定,且对初始条件敏感,容易陷入局部最优。
针对模糊聚类算法的这些问题,论文提出了一种新的分级混合聚类法(Hierarchical Hybrid Clustering Method, HHCM)。这种方法结合了自组织神经网络(Kohonen SOM)和基于熵的聚类算法,旨在提高聚类效率和保证聚类结果的有效性。首先,SOM用于对原始数据进行特征提取,减少数据维度并提取关键信息,然后基于熵的聚类算法对简化后的数据进行聚类,无需预设类别数目,降低了计算复杂度。
传统的模糊聚类算法如FCM(Fuzzy C-Means)和PCM(Partitioning Around Medoids)在优化过程中可能会遭遇局部最优问题,影响聚类质量。文献中提到的方法,如将Kohonen SOM与FCM结合,虽然可以提升算法速度,但仍然无法完全避免陷入局部极小值。另一方面,基于熵的聚类方法虽然不需要预设类别,但其有效性检验缺乏直接标准,可能导致非最优的聚类结果。
HHCM算法的独特之处在于其分级和混合的特性。分级体现在算法分为两个阶段,第一阶段通过SOM进行预处理,第二阶段使用熵为基础的聚类,降低了对初始条件的依赖。混合则体现在结合了监督学习(SOM)和无监督学习(熵聚类)的策略,提升了整体聚类性能。此外,由于它无需预设类别数,所以更具灵活性,适应性强。
通过实例,论文展示了HHCM算法在实际应用中的良好表现,能够有效地避免陷入局部极小值,提高了聚类速度,降低了计算复杂度,同时也保证了聚类的有效性。这种方法对于那些对计算效率有高要求且类别数目不明确的数据集来说,提供了一种有效的解决方案。
HHCM是一种创新的聚类方法,它融合了神经网络与熵理论,克服了传统模糊聚类算法的部分局限性,为大数据环境下的高效聚类分析提供了新的思路。
140 浏览量
2018-03-23 上传
2019-07-22 上传
2021-05-06 上传
2009-03-11 上传
2020-10-18 上传
2008-03-06 上传
2021-04-27 上传
weixin_38651165
- 粉丝: 4
- 资源: 901
最新资源
- 高清艺术文字图标资源,PNG和ICO格式免费下载
- mui框架HTML5应用界面组件使用示例教程
- Vue.js开发利器:chrome-vue-devtools插件解析
- 掌握ElectronBrowserJS:打造跨平台电子应用
- 前端导师教程:构建与部署社交证明页面
- Java多线程与线程安全在断点续传中的实现
- 免Root一键卸载安卓预装应用教程
- 易语言实现高级表格滚动条完美控制技巧
- 超声波测距尺的源码实现
- 数据可视化与交互:构建易用的数据界面
- 实现Discourse外聘回复自动标记的简易插件
- 链表的头插法与尾插法实现及长度计算
- Playwright与Typescript及Mocha集成:自动化UI测试实践指南
- 128x128像素线性工具图标下载集合
- 易语言安装包程序增强版:智能导入与重复库过滤
- 利用AJAX与Spotify API在Google地图中探索世界音乐排行榜