FIMT-DD算法的伪代码
时间: 2023-11-10 18:24:09 浏览: 36
以下是FIMT-DD算法的伪代码:
输入:训练数据集D,最小支持度阈值minsup,最小置信度阈值minconf
输出:频繁模式集合F和强规则集合S
1. 初始化:将D划分为若干个大小相等的子集,每个子集称为一个窗口,并设置一个计数器count
2. 对于每个窗口,执行以下步骤:
2.1. 对于每个事务t∈窗口,执行以下步骤:
2.1.1. 生成t的所有子集,并统计每个子集的出现次数
2.1.2. 对于每个频繁项集f,计算其在t中的支持度,并将其加入到f的支持度计数器中
2.2. 对于每个频繁项集f,如果其支持度大于等于minsup,则将其加入到F中,并将其支持度计数器加入到count中
2.3. 对于每个频繁项集f1∈F,执行以下步骤:
2.3.1. 生成f1的所有非空真子集,并计算它们与f1的差集的支持度
2.3.2. 对于每个非空真子集f2,如果f1/f2的支持度大于等于minconf,则将f1/f2加入到S中
3. 输出F和S
其中,/表示集合的差集运算。在第二步中,我们将每个频繁项集的支持度计数器加入到计数器count中,以便计算每个频繁项集在整个数据集D中的支持度。在第三步中,我们使用了强规则的定义,即规则f1/f2的置信度为f1在包含f2的事务中的支持度除以f2的支持度。如果f1/f2的置信度大于等于minconf,则认为f1/f2是一个强规则。