创新层次聚类与新相似度度量:提升大数据挖掘效率
123 浏览量
更新于2024-06-17
收藏 1.28MB PDF 举报
本文主要探讨了"基于簇聚类技术和新相似性度量的数据挖掘研究",特别是在物联网(IoT)背景下,随着数据量的爆炸性增长,如何有效地处理和分析未标记的大数据成为了一个关键挑战。层次聚类作为一种无监督学习方法,如聚集层次聚类(AHC),以其自底向上的聚类过程在数据挖掘中占据重要地位。然而,单一聚类方法可能不足以应对复杂问题,因此研究者提出了一个创新的集成聚类框架——模型选择的元聚类包围方案(MCEMS)。
MCEMS的核心在于结合AHC的个体方法和一种新的相似性度量。它通过双加权策略来优化模型选择,旨在提高集成聚类的效果。具体步骤包括:首先,多个AHC方法对数据进行独立聚类,形成主聚类;然后,根据不同的聚类结果,利用新相似性度量计算实例间的相似性;接着,通过元聚类阶段,重新组合主集群,并通过合并相似类和设定阈值来决定最佳聚类数量;最后,通过比较实例与元聚类的相似度,将实例分配到最适合的元聚类,从而形成最终的聚类结果。
为了验证MCEMS的有效性,研究者将其应用到UCI数据集中,并通过威尔科xon检验和共变性相关系数与HMM、DSPA和WHAC等先进算法进行了性能对比。实验结果显示,MCEMS算法在数据挖掘任务中表现优越,显示出其在大规模数据处理和复杂场景下显著的优势。
本文的研究对于提升层次聚类和集成聚类在大数据环境中的效率,以及改进相似性度量在无监督学习中的作用具有重要意义。此外,其开放获取的CCBY-NC-ND许可证允许了更广泛的学术交流和应用,促进了数据挖掘领域的知识共享和发展。
2012-11-15 上传
2011-01-08 上传
2021-07-14 上传
2021-05-26 上传
2016-01-23 上传
点击了解资源详情
点击了解资源详情
点击了解资源详情
cpongm
- 粉丝: 5
- 资源: 2万+
最新资源
- 高清艺术文字图标资源,PNG和ICO格式免费下载
- mui框架HTML5应用界面组件使用示例教程
- Vue.js开发利器:chrome-vue-devtools插件解析
- 掌握ElectronBrowserJS:打造跨平台电子应用
- 前端导师教程:构建与部署社交证明页面
- Java多线程与线程安全在断点续传中的实现
- 免Root一键卸载安卓预装应用教程
- 易语言实现高级表格滚动条完美控制技巧
- 超声波测距尺的源码实现
- 数据可视化与交互:构建易用的数据界面
- 实现Discourse外聘回复自动标记的简易插件
- 链表的头插法与尾插法实现及长度计算
- Playwright与Typescript及Mocha集成:自动化UI测试实践指南
- 128x128像素线性工具图标下载集合
- 易语言安装包程序增强版:智能导入与重复库过滤
- 利用AJAX与Spotify API在Google地图中探索世界音乐排行榜