有向gSpan改进的频繁子图挖掘算法提升效率

1 下载量 46 浏览量 更新于2024-08-12 收藏 620KB PDF 举报
本文主要探讨了"基于对gSpan改进的有向频繁子图挖掘算法"这一创新研究。该算法是在2011年由周溜溜和业宁两位作者针对南京林业大学信息技术学院的研究背景下提出的。传统上,频繁子图挖掘算法如FSG(快速频繁子图挖掘)、FFSM(基于先验的图挖掘)以及AGM等主要集中在无向图数据挖掘上,对于有向图的学习应用相对较少。gSpan算法作为经典的图模式挖掘方法,它的核心在于生成所有可能的频繁子图。 作者们意识到随着生命科学等领域的发展,有向图数据的生成日益增多,因此他们提出了一个针对有向图的新型挖掘策略DFSS(Directed Frequent Subgraph Mining based on gSpan)。这个改进算法区别于传统方法,它采用了独特的二维特征定义,这使得算法能够适应有向图的结构,从而突破了原有算法在处理有向图时的局限性。这种扩展不仅增加了算法的应用领域,也提高了在处理有向图数据时的效率。 相比于基于Apriori思想的FSG和AGM等算法,新提出的DFSS在时间复杂度方面有所优化,这意味着在保持挖掘完整性的前提下,其执行速度显著提升,尤其在大规模数据处理时,效率可以达到FFSM算法的70到80倍。这对于处理大量有向图数据的场景来说,无疑具有重要的实际意义。 关键词包括有向子图挖掘、gSpan、频繁子图和适用性扩展,这些都揭示了论文的核心内容和研究焦点。这篇论文提供了一个实用且高效的工具,以解决在有向图数据中寻找有意义模式的问题,对于推动有向图数据挖掘领域的研究和技术发展具有积极影响。