已知有如下的事务集 TID 购买的商品 T100 M, O, N, K, E, Y T200 D, O, N, K, E, Y T300 M, A, K, E T400 M, U, C, K, Y T500 C, O, K, I, E 设最小支持度为60%,最小置信度80% (1)采用Apriori算法找出所有频繁项集以及其支持度 (2)列出所有满足如下规则匹配的强关联规则 Item1 ∧ Item2 → Item3 其中Item1、Item2、Item3代表事务集中的某一个商品,且互不相同
时间: 2023-09-20 13:03:08 浏览: 80
(1) 采用Apriori算法找出所有频繁项集以及其支持度:
首先,统计每个商品项的支持度,得到以下表格:
商品项 支持度
M 3
O 2
N 2
K 4
E 4
Y 3
D 1
A 1
U 1
C 2
I 1
根据最小支持度60%,筛选出所有的频繁1项集:
频繁1项集 支持度
K 4
E 4
M 3
Y 3
C 2
O 2
N 2
然后,根据频繁1项集,使用Apriori算法,生成所有的频繁2项集:
频繁2项集 支持度
{K, E} 4
{K, M} 3
{K, Y} 2
{K, C} 2
{E, M} 2
{E, Y} 2
{E, C} 1
{M, Y} 1
{M, C} 1
再根据频繁2项集,生成所有的频繁3项集:
频繁3项集 支持度
{K, E, M} 2
因此,所有的频繁项集及其支持度如下:
频繁项集 支持度
{K} 4
{E} 4
{M} 3
{Y} 3
{C} 2
{O} 2
{N} 2
{K, E} 4
{K, M} 3
{K, Y} 2
{K, C} 2
{E, M} 2
{E, Y} 2
{E, C} 1
{M, Y} 1
{M, C} 1
{K, E, M} 2
(2) 列出所有满足如下规则匹配的强关联规则 Item1 ∧ Item2 → Item3,其中Item1、Item2、Item3代表事务集中的某一个商品,且互不相同:
根据频繁项集,计算所有的关联规则及其置信度,筛选出置信度大于等于80%的强关联规则:
关联规则 支持度 置信度
{K} → {E} 4 100%
{E} → {K} 4 100%
{K} → {M} 3 75%
{M} → {K} 3 100%
{K} → {Y} 2 50%
{Y} → {K} 2 67%
{K} → {C} 2 50%
{C} → {K} 2 100%
{E} → {M} 2 50%
{M} → {E} 2 67%
{E} → {Y} 2 50%
{Y} → {E} 2 67%
{E} → {C} 1 25%
{C} → {E} 1 50%
{M} → {Y} 1 33%
{Y} → {M} 1 33%
{M} → {C} 1 33%
{C} → {M} 1 50%
{K, E} → {M} 2 50%
{K, M} → {E} 2 67%
{E, M} → {K} 2 100%
{K, Y} → {E} 2 100%
{E, Y} → {K} 2 100%
{K, C} → {E} 1 50%
{E, C} → {K} 1 100%
{M, Y} → {K} 1 100%
{K, M, E} → {Y} 2 100%
{K, M, Y} → {E} 2 67%
{K, E, Y} → {M} 2 100%
{M, E, Y} → {K} 1 50%
因此,所有满足要求的强关联规则如下:
K → E
E → K
M → K
K → M
K → Y
Y → K
K → C
C → K
E → M
M → E
E → Y
Y → E
E → C
C → E
M → Y
Y → M
M → C
C → M
KE → M
KM → E
EM → K
KY → E
EY → K
KC → E
EC → K
MY → K
KME → Y
KMY → E
KEY → M
MEY → K
阅读全文