使用efficient_apriori包进行apriori算法代码实现
时间: 2023-12-22 13:05:13 浏览: 210
以下是使用`efficient_apriori`包进行Apriori算法的代码实现。首先需要安装`efficient_apriori`包,可以使用以下命令进行安装:
```python
!pip install efficient_apriori
```
然后,我们可以使用以下代码来执行Apriori算法:
```python
from efficient_apriori import apriori
# 构建数据集
transactions = [('牛奶', '面包', '尿布'),
('可乐', '面包', '尿布', '啤酒'),
('牛奶', '尿布', '啤酒', '鸡蛋'),
('面包', '牛奶', '尿布', '啤酒'),
('面包', '牛奶', '尿布', '可乐')]
# 挖掘频繁项集和关联规则
itemsets, rules = apriori(transactions, min_support=0.5, min_confidence=1)
print('频繁项集:', itemsets)
print('关联规则:', rules)
```
在这个例子中,我们使用了一个简单的数据集,其中包含了5个交易记录。我们设置了`min_support=0.5`来表示支持度阈值为50%,`min_confidence=1`来表示置信度阈值为100%。这意味着我们只会输出支持度大于等于50%的频繁项集,并且只会输出置信度为100%的关联规则。
输出如下:
```
频繁项集: {1: {('尿布',): 4, ('面包',): 4, ('牛奶',): 3, ('啤酒',): 2}, 2: {('尿布', '面包'): 3, ('尿布', '牛奶'): 3}}
关联规则: [{啤酒} -> {尿布}, {可乐} -> {尿布}, {鸡蛋} -> {尿布}, {面包} -> {尿布, 牛奶}, {牛奶} -> {尿布, 面包}]
```
可以看到,我们得到了所有支持度大于等于50%的频繁项集以及满足置信度为100%的关联规则。
阅读全文