Aprior算法思想和流程
时间: 2024-01-14 13:05:23 浏览: 51
Aprior算法建模_数据挖掘_
Apriori算法是一种常用的关联规则挖掘算法,其主要思想是利用频繁项集的性质来减少候选项集的数量,从而降低算法的复杂度。其流程如下:
1. 首先扫描数据集,统计每个数据项的支持度,并筛选出支持度不低于预设阈值的数据项,形成频繁1-项集。
2. 然后,利用频繁1-项集来生成候选2-项集。具体方法是,将频繁1-项集两两组合,得到所有可能的2-项集,然后扫描数据集,统计每个候选2-项集的支持度,并筛选出支持度不低于预设阈值的2-项集,形成频繁2-项集。
3. 接着,利用频繁2-项集来生成候选3-项集,具体方法同上。然后扫描数据集,统计每个候选3-项集的支持度,并筛选出支持度不低于预设阈值的3-项集,形成频繁3-项集。
4. 以此类推,直到所有的频繁k-项集都被找出为止。在实际应用中,通常只需寻找到频繁3-项集或4-项集即可。
5. 最后,根据频繁项集生成关联规则,并计算其置信度。将置信度不低于预设阈值的关联规则输出。
Apriori算法的核心思想是基于频繁项集的性质,通过逐步生成候选项集和筛选频繁项集,从而避免了对所有可能的项集进行支持度计算的复杂度。
阅读全文