NFTM:一种基于FP-Tree的高效频繁轨迹模式挖掘方法

0 下载量 40 浏览量 更新于2024-08-26 收藏 966KB PDF 举报
"基于FP-Tree模型的频繁轨迹模式挖掘方法是电子科技大学的研究论文,由牛新征、牛嘉郡、苏大壮和佘堃共同撰写。该论文提出了一种名为NFTM的新方法,旨在高效挖掘轨迹数据中的频繁模式。通过对经典FP-Tree数据结构的扩展和改进,NFTM能处理轨迹数据,并考虑了时空属性。在预处理阶段,使用二维筛选和GPS格式过滤来优化轨迹数据。接下来,通过一次扫描生成改进版的FP-tree,其中数据按真实的轨迹顺序排列。候选集使用动态数组存储,算法能够根据用户需求输出特定时间范围和频率的频繁轨迹。实验结果显示,NFTM相比GSP算法和Prefixspan算法具有更快的执行速度和更好的性能。该研究的关键词包括FP-tree、频繁轨迹模式、模式挖掘和时空属性。" 本文主要讨论了如何利用FP-Tree模型对频繁轨迹模式进行有效挖掘。FP-Tree是一种经典的数据结构,常用于频繁项集挖掘,但原始的FP-Tree并不直接适用于处理包含时空信息的轨迹数据。为了适应这种需求,研究者们对FP-Tree进行了扩展和改造,创建了NFTM(New FP-Tree for Frequent Trajectory Mining)算法。 在NFTM中,首先对原始轨迹数据进行预处理,这一步可能包括去除噪声、异常值以及标准化等操作。文中特别提到了二维筛选和GPS格式过滤技术,这些方法有助于清理和整理轨迹数据,使其更适合后续分析。之后,所有有效数据在一次扫描后被构造成为一种特殊的FP-tree,这种树状结构保留了轨迹的时空顺序,使得轨迹模式的发现更为直观和高效。 在模式挖掘阶段,NFTM使用动态数组来存储挖掘过程中的候选轨迹模式,动态数组允许快速地添加和删除元素,适合处理不确定数量的候选模式。此外,该算法还支持用户定制,可以根据用户指定的时间和频率范围来筛选出感兴趣的频繁轨迹模式,这在实际应用中具有很高的灵活性。 实验部分,NFTM被与两种常见的频繁模式挖掘算法GSP(Growth-Span)和Prefixspan进行了比较。结果显示,NFTM在执行时间上更短,表明其计算效率更高,同时在性能上也表现得更优秀,这意味着它在处理大规模轨迹数据时能提供更快的响应速度和更优的结果。 基于FP-Tree模型的频繁轨迹模式挖掘方法NFTM为时空轨迹数据的分析提供了新的解决方案,它有效地结合了FP-Tree的优势和轨迹数据的特性,提高了轨迹模式挖掘的效率和实用性。这对于交通管理、地理信息系统、智能物流等领域有着重要的理论和应用价值。