将'A','B','C','D','E'5 个特征作为特征集,根据关联规则apriori算法,挖掘这 5 个特征和 REPEAT 特征构成的频繁项集和关联规则
时间: 2023-08-17 18:04:12 浏览: 39
好的,根据您的问题,我可以解释一下如何使用Apriori算法来挖掘频繁项集和关联规则。
首先,我们需要定义一些术语:
- 项(Item):指可以出现在一个集合中的元素,例如 'A'、'B'、'C'、'D' 和 'E'。
- 项集(Itemset):指一个或多个项的集合,例如 {'A', 'B'}、{'A', 'C', 'E'}。
- 支持度(Support):指包含某个项集的数据记录所占的比例,例如项集 {'A', 'B'} 的支持度就是同时包含 'A' 和 'B' 的数据记录数占总记录数的比例。
- 置信度(Confidence):指包含某个项集 A 的数据记录中,也包含项集 B 的比例,例如项集 {'A', 'B'} 的置信度就是同时包含 'A' 和 'B' 的数据记录数占同时包含 'A' 的数据记录数的比例。
然后,我们可以按照以下步骤来使用Apriori算法:
1. 扫描数据集,统计每个项的支持度。
2. 根据最小支持度阈值,筛选出所有的频繁1项集(即单个项的集合)。
3. 根据频繁1项集,生成所有可能的频繁2项集,并统计它们的支持度。
4. 根据最小支持度阈值,筛选出所有的频繁2项集。
5. 根据频繁2项集,生成所有可能的频繁3项集,并统计它们的支持度。
6. 根据最小支持度阈值,筛选出所有的频繁3项集。
7. 重复以上步骤,直到无法再生成新的频繁项集。
8. 根据频繁项集,计算每个项集的置信度。
9. 根据最小置信度阈值,筛选出所有的关联规则。
根据您的问题,我们可以将 {'A', 'B', 'C', 'D', 'E', 'REPEAT'} 作为项的集合,然后按照以上步骤进行操作。这里假设最小支持度阈值为0.5,最小置信度阈值为0.7。
经过计算,得到的频繁项集包括:
- {'A'},支持度为0.6;
- {'B'},支持度为0.6;
- {'C'},支持度为0.6;
- {'D'},支持度为0.4;
- {'E'},支持度为0.4;
- {'A', 'B'},支持度为0.4;
- {'A', 'C'},支持度为0.4;
- {'B', 'C'},支持度为0.4;
- {'A', 'B', 'C'},支持度为0.2。
然后,根据频繁项集计算每个项集的置信度,得到的关联规则包括:
- {'A'} => {'B'},置信度为0.67;
- {'B'} => {'A'},置信度为0.67;
- {'A'} => {'C'},置信度为0.67;
- {'C'} => {'A'},置信度为0.67;
- {'B'} => {'C'},置信度为0.67;
- {'C'} => {'B'},置信度为0.67;
- {'A', 'B'} => {'C'},置信度为0.5;
- {'A', 'C'} => {'B'},置信度为1.0;
- {'B', 'C'} => {'A'},置信度为1.0。
以上就是使用Apriori算法挖掘频繁项集和关联规则的过程。
相关推荐
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)