30. 给定如下表所示的一个事务数据集,假定最小支持度为0.5,请给出Apriori算法生成频繁项集的过程
时间: 2023-12-06 20:40:42 浏览: 83
python处理UCI鲍鱼数据集
5星 · 资源好评率100%
给定的事务数据集如下:
| 事务ID | 事务项 |
|--------|--------|
| T1 | A, B, D |
| T2 | B, C |
| T3 | A, B, C |
| T4 | B, C |
| T5 | A, D |
首先,我们需要得到所有单个项的支持度计数,即每个项在多少个事务中出现过。
| 项 | 支持度计数 |
|------|------------|
| A | 3 |
| B | 4 |
| C | 3 |
| D | 2 |
接下来,我们使用最小支持度0.5来筛选出频繁1项集,即支持度计数大于等于3的项。
| 频繁1项集 | 支持度计数 |
|-----------|------------|
| B | 4 |
| A | 3 |
| C | 3 |
然后,我们使用频繁1项集来生成候选2项集。我们将每个频繁1项集与其它所有频繁1项集进行组合,得到以下候选2项集:
| 候选2项集 |
|----------|
| A, B |
| A, C |
| B, C |
| B, D |
接下来,我们扫描事务数据集,计算每个候选2项集的支持度计数。
| 候选2项集 | 支持度计数 |
|----------|------------|
| A, B | 2 |
| A, C | 1 |
| B, C | 3 |
| B, D | 1 |
然后,我们筛选出支持度计数大于等于3的候选2项集作为频繁2项集。
| 频繁2项集 | 支持度计数 |
|-----------|------------|
| B, C | 3 |
接下来,我们使用频繁2项集来生成候选3项集。我们将每个频繁2项集的前缀与其它所有频繁2项集的前缀进行组合,得到以下候选3项集:
| 候选3项集 |
|-----------|
| A, B, C |
我们扫描事务数据集,计算候选3项集的支持度计数。
| 候选3项集 | 支持度计数 |
|-----------|------------|
| A, B, C | 1 |
我们筛选出支持度计数大于等于3的候选3项集作为频繁3项集。由于没有符合条件的频繁3项集,因此算法结束。
最终,我们得到的频繁项集如下:
| 频繁项集 |
|----------|
| B |
| A |
| C |
| B, C |
阅读全文