如何采用FP-Growth算法,建立FP-Tree,挖掘频繁项集
时间: 2024-05-29 17:09:26 浏览: 82
基于频繁增长树(FP-树)的频繁项集挖掘算法实现
4星 · 用户满意度95%
FP-Growth算法的过程如下:
1. 统计所有项的频数,删除不满足最小支持度要求的项。
2. 对所有事务进行排序,通常是根据项的频数从高到低排序。
3. 从事务中开始建立FP-Tree,每个事务中的项按照排序后的次序插入。
4. 每个项都从树根开始,如果在当前层已经有相同项存在,则将其计数增加,否则,在当前层新建一个节点,表示该项。
5. 继续处理下一个项,直到当前事务中所有项都处理完。
6. 重复步骤3~5,直到所有事务构建出FP-Tree。
7. 从FP-Tree中挖掘频繁项集。
阅读全文