IITM算法:一种高效频繁模式挖掘新方法

需积分: 6 0 下载量 72 浏览量 更新于2024-09-09 收藏 1.23MB PDF 举报
"这篇论文介绍了一种名为Interval Interaction and Transaction Mapping (IITM)的高效频繁模式挖掘算法,该算法旨在解决关联规则挖掘中的效率问题。IITM算法结合了Apriori和FP-growth的优点,通过事务映射和区间求交的方法,减少对数据集的扫描次数,提高挖掘效率。" 详细内容: 关联规则挖掘是数据挖掘领域的一个核心任务,它从大规模数据中发现有趣的项集及其关联规则。随着大数据时代的到来,对关联规则挖掘算法的效率需求日益提高。在这个背景下,论文提出了一种新的频繁模式挖掘算法IITM,它针对Apriori和FP-growth算法的不足进行了优化。 Apriori算法以其先验知识为基础,通过反复扫描数据集来消除不频繁项集,然而这种方法可能导致大量的无效扫描,效率较低。而FP-growth算法虽然避免了Apriori的多次扫描,但需要迭代地生成条件FP树,这同样增加了计算负担。 IITM算法创新性地引入了事务映射和区间求交的概念。首先,它只需要两次扫描数据集来构建FP树。接着,算法将每个项的ID映射到特定的区间,这样每个事务就可以被表示为一组区间。在模式增长阶段,通过区间求交操作,可以快速确定哪些项集是频繁的,而无需额外的扫描或迭代过程。 实验结果显示,IITM在不同支持度下都表现出优于Apriori、FP-growth以及PIETM算法的性能。这意味着IITM算法在处理大数据集时具有更高的效率和更好的可扩展性。这对于大数据环境下的关联规则挖掘具有重要的实际应用价值。 此外,论文还提到了IITM算法背后的研究团队,包括吴磊、程良伦和王涛,他们分别在数据挖掘、网络控制和物联网等领域有深入的研究。该研究得到了多项国家级和省级科研项目的资助,表明了其在学术界和工业界的关注。 IITM算法通过事务映射和区间求交技术,成功地提高了频繁模式挖掘的效率,降低了计算复杂性,为大数据环境下的关联规则挖掘提供了一个有效的解决方案。这一成果对于推动数据挖掘领域的进步,特别是对于需要实时分析和快速响应的业务场景,具有显著的意义。