Apriori算法提升度的实现
时间: 2023-06-13 18:05:05 浏览: 51
Apriori算法是一种常见的关联规则挖掘算法,它可以用来发现数据集中的频繁项集,进而发现项集之间的关联规则。提升度是一个用来衡量关联规则强度的指标,它表示当出现规则的前提条件时,后件条件发生的概率与后件条件本身发生概率之比。
Apriori算法提升度可以使用以下公式进行计算:
```
lift(X -> Y) = support(X ∪ Y) / (support(X) * support(Y))
```
其中,X和Y是两个项集,support(X)表示项集X的支持度,即在数据集中出现X的次数除以数据集的总记录数;support(Y)表示项集Y的支持度;support(X ∪ Y)表示项集X和Y联合出现的支持度,即同时出现X和Y的次数除以数据集的总记录数。
下面是Apriori算法提升度的实现代码:
```
def calc_lift(itemset, freq_set, dataset):
item1, item2 = itemset
support_x_y = freq_set[itemset] / float(len(dataset))
support_x = freq_set[item1] / float(len(dataset))
support_y = freq_set[item2] / float(len(dataset))
return support_x_y / (support_x * support_y)
```
其中,itemset是一个二元组,表示待计算提升度的两个项;freq_set是频繁项集的支持度计数表;dataset是原始数据集。函数返回项集X和Y的提升度。
相关推荐
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)