有9个ID,从1至9.Items分别是A、B、E;B、D;B、C;A、B、D;A、C;B、C;A、C;A、B、C、E;A、B、C。假设最小支持度最小支持度阈值为2/9,最小置信度阈值为50%。列出所有的频繁项集和其支持度并给出它们的封闭项集和最大频繁项集,对于最大频繁项集列出所有强关联规则。
时间: 2023-11-11 07:03:31 浏览: 44
根据您提供的数据和阈值,我们可以用FP-growth算法来挖掘频繁项集和关联规则,具体步骤如下:
1. 构建FP树,得到每个项的支持度,并筛选掉支持度小于最小支持度阈值的项。
| 项 | 支持度 |
|----|--------|
| A | 5 |
| B | 6 |
| C | 4 |
| D | 2 |
| E | 2 |
2. 根据支持度从大到小排序得到频繁项集。
| 频繁项集 | 支持度 |
|---------|--------|
| B | 6 |
| A | 5 |
| C | 4 |
| A,B | 3 |
| B,C | 3 |
| A,C | 3 |
| A,B,C | 2 |
3. 对于每个频繁项集,找到其所有封闭项集和最大频繁项集。
| 频繁项集 | 封闭项集 | 最大频繁项集 |
|---------|----------|--------------|
| B | B | B |
| A | A | A |
| C | C | C |
| A,B | B | B |
| B,C | B,C | A,B,C |
| A,C | A,C | A,B,C |
| A,B,C | A,B,C | A,B,C |
4. 对于最大频繁项集,列出所有强关联规则。
| 规则 | 支持度 | 置信度 |
|--------|--------|--------|
| A->B,C | 2 | 40% |
| B->A,C | 2 | 33.3% |
| C->A,B | 2 | 50% |
| A,B->C | 2 | 66.7% |
以上就是所有频繁项集及其支持度,以及每个频繁项集的封闭项集和最大频繁项集。同时也列出了最大频繁项集的所有强关联规则。
阅读全文