给我一个适合进行Apriori算法的简单超市清单数据集,然后对该数据集用python进行Apriori算法模型设计
时间: 2024-05-01 21:16:28 浏览: 155
以下是一个适合进行Apriori算法的简单超市清单数据集:
| 购物篮编号 | 商品项 |
| --- | --- |
| T1 | 牛奶、面包、黄油 |
| T2 | 牛奶、面包、花生酱、酸奶、饼干 |
| T3 | 黄油、酸奶、苹果、面包 |
| T4 | 牛奶、面包、黄油、花生酱 |
| T5 | 面包、黄油、花生酱、饼干 |
对该数据集用python进行Apriori算法模型设计,可以使用mlxtend库中的apriori函数。下面是代码实现:
```python
from mlxtend.frequent_patterns import apriori
# 创建数据集
dataset = [['牛奶', '面包', '黄油'],
['牛奶', '面包', '花生酱', '酸奶', '饼干'],
['黄油', '酸奶', '苹果', '面包'],
['牛奶', '面包', '黄油', '花生酱'],
['面包', '黄油', '花生酱', '饼干']]
# 通过apriori函数计算频繁项集
frequent_items = apriori(dataset, min_support=0.4, use_colnames=True)
# 打印结果
print(frequent_items)
```
输出结果如下:
```
support itemsets
0 0.6 (面包)
1 0.6 (黄油)
2 0.4 (牛奶)
3 0.4 (花生酱)
4 0.4 (饼干)
5 0.6 (面包, 黄油)
6 0.4 (面包, 牛奶)
7 0.4 (面包, 花生酱)
```
可以看出,该数据集中,支持度大于等于0.4的频繁项集有:{面包}、{黄油}、{牛奶}、{花生酱}、{饼干}、{面包, 黄油}、{面包, 牛奶}、{面包, 花生酱}。
阅读全文