AWAPM_SPRMII: 一种高效的完全加权正负关联模式挖掘算法

需积分: 10 0 下载量 179 浏览量 更新于2024-09-07 收藏 951KB PDF 举报
本文主要探讨了一种名为"AWAPM_SPRMII"的新型完全加权正负关联模式挖掘算法。论文首先强调了完全加权正负关联模式在文本挖掘和信息检索等领域的重要性和实际应用价值。现有的挖掘算法存在一些不足,因此作者针对这些问题进行改进。 论文的核心贡献在于构建了一个全新的评价框架——SPRMII(Support-Probability Ratio-Mutual Information-Interest),它结合了支持度、概率比、互信息和兴趣度等多个维度来评估关联模式的有趣程度。SPRMII框架的引入有助于更准确地识别出那些既频繁又具有显著关联性的项集,特别是那些包含负项集的情况。 为了优化算法效率,论文提出了一个完全加权项集双兴趣度阈值剪枝策略,这是一种新颖的剪枝技术,可以减少在搜索过程中的无用计算。通过这个策略,AWAPM_SPRMII算法能够在处理完全加权数据库时有效地挖掘出具有高兴趣度的频繁项集和负项集。 该算法的主要特点是能够克服传统挖掘算法的缺陷,利用简单的项集权重维数比计算和SPRMII评价框架,挖掘出有效的完全加权正负关联规则。通过理论分析和实验证明,AWAPM_SPRMII算法表现出较高的效率和良好的扩展性,其挖掘性能在与经典的挖掘算法比较时显示出优势。 作者团队包括高亮、夏冰和黄名选三位学者,他们在数据挖掘、分布式计算、舆情分析、网络安全和信息检索等领域有着丰富的研究背景。他们的合作展示了对完全加权正负关联模式挖掘的深入理解,并期待该算法能为相关领域的研究和实践提供有力支持。 这篇论文不仅提出了一个新的算法框架,还对其进行了详尽的理论分析和实验验证,为数据挖掘领域提供了有价值的改进方法,特别是在处理完全加权数据时,能够更高效地挖掘出有意义的关联规则。这对于提升信息检索和文本挖掘的精度具有重要意义。