异构数据集混合聚类框架:保持信息完整性
需积分: 8 55 浏览量
更新于2024-08-12
收藏 696KB PDF 举报
在信息技术领域,异构数据集挖掘是一项重要的研究课题,因为现实世界中的数据往往包含不同类型的属性,如数值、二进制、名义和序数属性。传统聚类算法假设数据集是同质的,但在处理异构数据时可能会导致信息丢失。为了克服这个问题,本文提出了一个创新的"异构数据集挖掘框架",该框架专注于混合聚类方法。
这篇论文的标题"异构数据集挖掘框架"揭示了研究的核心焦点,即开发一种能够有效处理不同类型属性的聚类算法。作者们注意到,许多先前的研究已经在尝试利用各种聚类策略,但这些策略要么依赖于属性的预处理,将它们转换成同质类型,要么假设属性间的相似性度量是固定的。然而,这样的做法可能会牺牲数据的原始信息。
论文的主要贡献在于提出了一种新的混合相似性度量方法,它能够在不改变数据特征的情况下,识别并聚集具有异质属性的相似对象集。这种方法能够更好地保留数据的多样性,并在处理异构数据集时提供更精确的结果。混合聚类算法的设计旨在适应不同类型属性的数据,例如,它可能包括对数值型数据的距离计算、二进制数据的逻辑运算,以及对名义和序数数据的编码处理,以确保在综合考虑所有属性的基础上进行有效的聚类。
此外,论文还提到了实验部分的结果,展示了新提出的聚类算法在实际应用中的优势。与传统的聚类算法相比,该算法在保持信息完整性和提高分类准确率方面表现出色。研究结果发表在2017年国际会议"智能计算系统"(ICICS)上,由Sona技术学院主办,且被收录在Elsevier的SSRN电子图书馆中,期刊为《信息系统与电子商务网络》(Journal of Information Systems & e-Business Network),ISSN为1556-5068。
这篇研究论文不仅为解决异构数据集的聚类问题提供了新的视角,而且通过实践验证了其在提高聚类性能方面的有效性。这对于数据科学家和工程师来说,是一个有益的工具,特别是在处理大量现实世界复杂数据集时,能够有效地提取有价值的信息和知识。
2013-06-08 上传
2009-12-29 上传
2021-04-28 上传
2019-08-23 上传
2013-05-19 上传
2021-03-14 上传
点击了解资源详情
点击了解资源详情
点击了解资源详情
weixin_38651165
- 粉丝: 4
- 资源: 901
最新资源
- SSM动力电池数据管理系统源码及数据库详解
- R语言桑基图绘制与SCI图输入文件代码分析
- Linux下Sakagari Hurricane翻译工作:cpktools的使用教程
- prettybench: 让 Go 基准测试结果更易读
- Python官方文档查询库,提升开发效率与时间节约
- 基于Django的Python就业系统毕设源码
- 高并发下的SpringBoot与Nginx+Redis会话共享解决方案
- 构建问答游戏:Node.js与Express.js实战教程
- MATLAB在旅行商问题中的应用与优化方法研究
- OMAPL138 DSP平台UPP接口编程实践
- 杰克逊维尔非营利地基工程的VMS项目介绍
- 宠物猫企业网站模板PHP源码下载
- 52简易计算器源码解析与下载指南
- 探索Node.js v6.2.1 - 事件驱动的高性能Web服务器环境
- 找回WinSCP密码的神器:winscppasswd工具介绍
- xctools:解析Xcode命令行工具输出的Ruby库