已知有如下的事务集 TID 购买的商品 T100 M, O, N, K, E, Y T200 D, O, N, K, E, Y T300 M, A, K, E T400 M, U, C, K, Y T500 C, O, K, I, E 设最小支持度为60%,最小置信度80% (1)采用Apriori算法找出所有频繁项集以及其支持度
时间: 2023-09-15 15:21:36 浏览: 235
RJP020N06T100-VB一款SOT89-3封装 MOSFET参数应用解析
首先,我们需要计算每个商品项的支持度,即出现在事务集中的频率。其次,我们可以使用Apriori算法来查找频繁项集,并通过计算置信度来确定关联规则。
计算每个商品项的支持度:
- M: 3
- O: 3
- N: 2
- K: 4
- E: 4
- Y: 3
- D: 1
- A: 1
- U: 1
- C: 2
- I: 1
总的事务数为5,因此每个商品项的支持度为它在事务集中出现的次数除以5。例如,M的支持度为3/5 = 0.6。
接下来,使用Apriori算法来查找频繁项集:
- 第一轮扫描:找出所有单个商品项的频繁项集,即支持度大于等于最小支持度的商品项。在这个例子中,只有M、O、K、E和Y满足这个条件。
- 第二轮扫描:找出所有由两个商品项组成的频繁项集,即支持度大于等于最小支持度的商品项对。在这个例子中,只有MO、MK、ME、MY、OK、OE、OY、KE和KY满足这个条件。
- 第三轮扫描:找出所有由三个商品项组成的频繁项集,即支持度大于等于最小支持度的商品项三元组。在这个例子中,只有MKE满足这个条件。
因此,所有的频繁项集以及它们的支持度为:
- {M}: 0.6
- {O}: 0.6
- {K}: 0.8
- {E}: 0.8
- {Y}: 0.6
- {M, O}: 0.6
- {M, K}: 0.6
- {M, E}: 0.6
- {M, Y}: 0.6
- {O, K}: 0.6
- {O, E}: 0.6
- {O, Y}: 0.6
- {K, E}: 0.8
- {K, Y}: 0.6
- {E, Y}: 0.6
- {M, K, E}: 0.6
接下来,我们可以使用频繁项集来生成关联规则,并计算它们的置信度。例如,从频繁项集{M, K, E}中可以生成以下关联规则:
- {M, K} => {E}
- {M, E} => {K}
- {K, E} => {M}
这些规则的置信度可以通过计算在规则的前提条件(即左侧)出现的事务中,同时出现在规则的后件条件(即右侧)的事务的比例来计算。例如,对于规则{M, K} => {E},它的置信度为0.6/0.6 = 1,因为所有包含{M, K}的事务也包含了{E}。
因此,在最小置信度为80%的情况下,只有规则{M, K} => {E}满足要求。
阅读全文