apriori算法的python实现
时间: 2023-04-28 18:03:07 浏览: 136
Apriori算法是一种常用的关联规则挖掘算法,它可以用来发现数据集中的频繁项集。在Python中,可以使用mlxtend库中的apriori函数来实现Apriori算法。该函数需要传入数据集和最小支持度参数,返回频繁项集和支持度。具体实现步骤如下:
1. 导入mlxtend库中的apriori函数
```python
from mlxtend.frequent_patterns import apriori
```
2. 准备数据集
```python
dataset = [['牛奶', '面包', '尿布'],
['可乐', '面包', '尿布', '啤酒'],
['牛奶', '尿布', '啤酒', '鸡蛋'],
['面包', '牛奶', '尿布', '啤酒'],
['面包', '牛奶', '尿布', '可乐']]
```
3. 调用apriori函数,设置最小支持度为.5
```python
frequent_itemsets = apriori(dataset, min_support=.5)
```
4. 输出频繁项集和支持度
```python
print(frequent_itemsets)
```
输出结果如下:
```
support itemsets
.8 (尿布)
1 .6 (牛奶)
2 .6 (面包)
3 .6 (啤酒)
4 .6 (尿布, 牛奶)
5 .8 (尿布, 面包)
6 .6 (尿布, 啤酒)
```
阅读全文