提高不确定数据集频繁模式挖掘效率的近似算法AAT-Mine
需积分: 0 177 浏览量
更新于2024-09-08
收藏 1.04MB PDF 举报
"一种不确定数据集上频繁模式挖掘的近似算法"
这篇论文研究的主要目标是提高在处理不确定数据集上的频繁模式挖掘效率。在传统的频繁模式挖掘算法中,尤其是在判断是否需要为头表中的某项创建子头表时,计算量较大,这成为算法效率的一个瓶颈。针对这一问题,论文提出了一种名为AAT-Mine的近似挖掘策略。AAT-Mine算法通过牺牲小部分频繁项集的精确性,以换取整体挖掘效率的显著提升。
在不确定数据集中,数据项可能带有概率或不确定性,这使得挖掘频繁模式变得更加复杂。频繁模式是指在数据集中出现次数超过预设阈值的项集。传统的挖掘算法如Apriori等在处理这类数据时,需要多次扫描数据并维护头表,计算量大且耗时。
AAT-Mine算法的核心思想是在挖掘过程中引入一定的近似性,通过减少对所有项集进行完整支持度检查的次数,来优化计算过程。它允许一定程度的误差,即可能会丢失一些频繁但支持度较低的项集,以此换取时间和空间效率的提高。在实际应用中,这种牺牲通常可以接受,特别是在大数据集和实时分析的场景下。
为了验证AAT-Mine算法的有效性,论文作者使用了三个不同的典型数据集进行实验,并将其性能与当前最佳的算法以及典型的挖掘算法进行了对比。实验结果显示,AAT-Mine算法在时间和空间效率上都有所提升,表明该算法在不确定数据集的频繁模式挖掘中具有较好的适用性和竞争力。
此外,论文还介绍了参与研究的作者,包括他们的背景和研究方向,如数据挖掘、软件工程和人工智能等。这些信息表明,研究团队具有扎实的专业基础和实践经验,能够为解决不确定数据集上的挖掘问题提供有力的支持。
总结起来,AAT-Mine是一种针对不确定数据集的高效近似频繁模式挖掘算法,它通过牺牲部分精确性来换取整体效率的提高,对于大数据环境下的实时分析和决策支持具有重要的实践价值。此算法的提出为不确定数据集的挖掘提供了新的思路,有助于推动数据挖掘领域的进一步发展。
2019-07-23 上传
110 浏览量
180 浏览量
122 浏览量
106 浏览量
128 浏览量
112 浏览量

weixin_39840650
- 粉丝: 412
最新资源
- 深入解析JavaWeb中Servlet、Jsp与JDBC技术
- 粒子滤波在视频目标跟踪中的应用与MATLAB实现
- ISTQB ISEB基础级认证考试BH0-010题库解析
- 深入探讨HTML技术在hundeakademie中的应用
- Delphi实现EXE/DLL文件PE头修改技术
- 光线追踪:探索反射与折射模型的奥秘
- 构建http接口以返回json格式,使用SpringMVC+MyBatis+Oracle
- 文件驱动程序示例:实现缓存区读写操作
- JavaScript顶盒技术开发与应用
- 掌握PLSQL: 从语法到数据库对象的全面解析
- MP4v2在iOS平台上的应用与编译指南
- 探索Chrome与Google Cardboard的WebGL基础VR实验
- Windows平台下的IOMeter性能测试工具使用指南
- 激光切割板材表面质量研究综述
- 西门子200编程电缆PPI驱动程序下载及使用指南
- Pablo的编程笔记与机器学习项目探索