有4个事务,{K,A,B,D},{C,A,B,D},{A,B,C,E},{A,B,D}。最小支持度是0.6,最小置信度是0.8。请用F-P增长算法求出频繁项集
时间: 2023-10-06 18:08:42 浏览: 63
1. 首先计算每个项的支持度,即出现在事务中的次数除以总事务数:
- K的支持度为1/4=0.25
- A的支持度为4/4=1
- B的支持度为4/4=1
- D的支持度为3/4=0.75
- C的支持度为2/4=0.5
- E的支持度为1/4=0.25
2. 根据最小支持度找出频繁项集:
- {A}的支持度为1,大于等于最小支持度0.6,是频繁项集。
- {B}的支持度为1,大于等于最小支持度0.6,是频繁项集。
- {D}的支持度为0.75,大于等于最小支持度0.6,是频繁项集。
- {A,B}的支持度为1,大于等于最小支持度0.6,是频繁项集。
- {A,D}的支持度为0.75,大于等于最小支持度0.6,是频繁项集。
- {B,D}的支持度为0.75,大于等于最小支持度0.6,是频繁项集。
3. 根据频繁项集生成候选规则,并计算置信度:
- {A} -> {B}的置信度为1/1=1,大于等于最小置信度0.8,是强规则。
- {B} -> {A}的置信度为1/1=1,大于等于最小置信度0.8,是强规则。
- {A} -> {D}的置信度为0.75/1=0.75,小于最小置信度0.8,不是强规则。
- {D} -> {A}的置信度为0.75/0.75=1,大于等于最小置信度0.8,是强规则。
- {B} -> {D}的置信度为0.75/1=0.75,小于最小置信度0.8,不是强规则。
- {D} -> {B}的置信度为0.75/0.75=1,大于等于最小置信度0.8,是强规则。
- {A,B} -> {D}的置信度为0.75/1=0.75,小于最小置信度0.8,不是强规则。
- {A,D} -> {B}的置信度为0.75/0.75=1,大于等于最小置信度0.8,是强规则。
- {B,D} -> {A}的置信度为0.75/0.75=1,大于等于最小置信度0.8,是强规则。
因此,频繁项集为{A},{B},{D},{A,B},{A,D},{B,D},强规则为{A} -> {B},{B} -> {A},{D} -> {A},{D} -> {B},{A,D} -> {B},{B,D} -> {A}。
阅读全文