给定如下的购物篮事务,令最小支持度计数为3。请使用Aprior算法找出所有的频繁项集,并写出每一层的候选项集和频繁项集。
时间: 2024-02-03 17:12:44 浏览: 46
购物篮事务如下:
```
{1,2,3,4}
{1,2,3}
{1,2,4}
{1,3,4}
{2,3,4}
{1,2}
{1,3}
{1,4}
{2,3}
{2,4}
{3,4}
```
首先,生成所有单项集的候选项集和频繁项集:
```
候选项集:{1}, {2}, {3}, {4}
频繁项集:{1}, {2}, {3}, {4}
```
接下来,根据频繁项集生成所有的二项集的候选项集,再根据最小支持度计数筛选出频繁项集:
```
候选项集:{1,2}, {1,3}, {1,4}, {2,3}, {2,4}, {3,4}
频繁项集:{1,2}, {1,3}, {1,4}, {2,3}, {2,4}, {3,4}
```
然后,根据频繁项集生成所有的三项集的候选项集,再根据最小支持度计数筛选出频繁项集:
```
候选项集:{1,2,3}, {1,2,4}, {1,3,4}, {2,3,4}
频繁项集:{1,2,3}, {1,2,4}, {1,3,4}, {2,3,4}
```
最后,根据频繁项集生成所有的四项集的候选项集,再根据最小支持度计数筛选出频繁项集(由于没有四项集的频繁项集,故此步骤省略)。
因此,所有的频繁项集为:
```
{1}, {2}, {3}, {4},
{1,2}, {1,3}, {1,4}, {2,3}, {2,4}, {3,4},
{1,2,3}, {1,2,4}, {1,3,4}, {2,3,4}
```
相关问题
30. 给定如下表所示的一个事务数据集,假定最小支持度为0.5,请给出Apriori算法生成频繁项集的过程
给定的事务数据集如下:
| 事务ID | 事务项 |
|--------|--------|
| T1 | A, B, D |
| T2 | B, C |
| T3 | A, B, C |
| T4 | B, C |
| T5 | A, D |
首先,我们需要得到所有单个项的支持度计数,即每个项在多少个事务中出现过。
| 项 | 支持度计数 |
|------|------------|
| A | 3 |
| B | 4 |
| C | 3 |
| D | 2 |
接下来,我们使用最小支持度0.5来筛选出频繁1项集,即支持度计数大于等于3的项。
| 频繁1项集 | 支持度计数 |
|-----------|------------|
| B | 4 |
| A | 3 |
| C | 3 |
然后,我们使用频繁1项集来生成候选2项集。我们将每个频繁1项集与其它所有频繁1项集进行组合,得到以下候选2项集:
| 候选2项集 |
|----------|
| A, B |
| A, C |
| B, C |
| B, D |
接下来,我们扫描事务数据集,计算每个候选2项集的支持度计数。
| 候选2项集 | 支持度计数 |
|----------|------------|
| A, B | 2 |
| A, C | 1 |
| B, C | 3 |
| B, D | 1 |
然后,我们筛选出支持度计数大于等于3的候选2项集作为频繁2项集。
| 频繁2项集 | 支持度计数 |
|-----------|------------|
| B, C | 3 |
接下来,我们使用频繁2项集来生成候选3项集。我们将每个频繁2项集的前缀与其它所有频繁2项集的前缀进行组合,得到以下候选3项集:
| 候选3项集 |
|-----------|
| A, B, C |
我们扫描事务数据集,计算候选3项集的支持度计数。
| 候选3项集 | 支持度计数 |
|-----------|------------|
| A, B, C | 1 |
我们筛选出支持度计数大于等于3的候选3项集作为频繁3项集。由于没有符合条件的频繁3项集,因此算法结束。
最终,我们得到的频繁项集如下:
| 频繁项集 |
|----------|
| B |
| A |
| C |
| B, C |
最小支持度为3,请写出1-项集和2项集的频繁项集
好的,假设有以下数据集:
```
{A, B, C}
{A, B, D}
{B, D, E}
{A, B, E}
{B, C, E}
```
最小支持度为3,即出现次数不少于3次的项集为频繁项集。
1-项集:{A}, {B}, {C}, {D}, {E}
其中,{A} 出现2次,{B} 出现4次,{C} 出现2次,{D} 出现2次,{E} 出现3次,所以 {B}, {E} 是频繁项集。
2-项集:{A, B}, {A, C}, {A, D}, {A, E}, {B, C}, {B, D}, {B, E}, {C, E}, {D, E}
其中,{A, B} 出现3次,{A, C} 出现1次,{A, D} 出现1次,{A, E} 出现2次,{B, C} 出现1次,{B, D} 出现2次,{B, E} 出现3次,{C, E} 出现1次,{D, E} 出现1次,所以 {A, B}, {B, E} 是频繁项集。
相关推荐
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)