关联规则分类 cba python代码
时间: 2023-09-11 09:08:14 浏览: 124
以下是使用 Python 实现关联规则分类的示例代码:
```python
from efficient_apriori import apriori
# 准备数据
dataset = [
['牛奶', '面包', '尿布'],
['可乐', '面包', '尿布', '啤酒'],
['牛奶', '尿布', '啤酒', '鸡蛋'],
['面包', '牛奶', '尿布', '啤酒'],
['面包', '牛奶', '尿布', '可乐']
]
# 使用 Apriori 算法找出频繁项集
itemsets, _ = apriori(dataset, min_support=0.5)
# 打印频繁项集
print(itemsets)
# 使用 Apriori 算法找出关联规则
_, rules = apriori(dataset, min_support=0.5, min_confidence=1)
# 打印关联规则
print(rules)
```
这段代码将会输出两个结果:频繁项集和关联规则。
频繁项集是经过 Apriori 算法处理后得到的一组包含任意项数的项集,它们出现的频率超过了预设的最小支持度阈值。在这个示例中,出现频率超过了 50% 的项集为 {'尿布'},{'面包'},{'牛奶'}。
关联规则是由频繁项集派生的一组规则,它们包含条件和结论两个部分,中间用箭头连接。条件和结论都是项集,而且条件和结论不能同时为空。在这个示例中,满足最小置信度阈值(这里设为 100%)的关联规则为:{'尿布'} → {'面包'}、{'面包'} → {'尿布'}、{'牛奶'} → {'尿布'}、{'尿布'} → {'牛奶'}、{'啤酒'} → {'尿布'}、{'尿布'} → {'啤酒'}、{'啤酒'} → {'牛奶'}、{'牛奶'} → {'啤酒'}、{'可乐'} → {'尿布'}、{'尿布'} → {'可乐'}、{'面包', '尿布'} → {'牛奶'}、{'牛奶', '尿布'} → {'面包'}、{'面包', '牛奶'} → {'尿布'}、{'尿布', '牛奶'} → {'面包'}、{'面包', '尿布'} → {'牛奶'}、{'牛奶', '面包'} → {'尿布'}。
这些关联规则可以发挥出关联规则分类的作用,例如可以根据顾客购买了哪些商品,推测他们可能对哪些商品感兴趣,并根据此做出适当的营销策略。
阅读全文