啤酒和尿布的关联规则实战代码
时间: 2024-11-30 10:29:04 浏览: 22
啤酒和尿布的故事是经典的关联规则学习案例,它起源于超市销售数据的研究,展示了商品之间的有趣联系。这种现象通常被称为"意外的巧合",即人们在购买啤酒的同时可能会买尿布,可能是男性顾客在晚上购物,同时需要这两种商品。
在Apriori算法(一种常用的关联规则挖掘算法)的实际应用中,假设我们有一个简单的Python示例,使用`mlxtend`库来处理这个数据集:
```python
from mlxtend.preprocessing import TransactionEncoder
from mlxtend.frequent_patterns import apriori, association_rules
# 假设这是销售数据,每行代表一次购买行为,逗号分隔的商品列表
data = [['bread', 'milk'], ['beer', 'noodles'], ['beer', '尿布', 'cola'], ['bread', 'milk', '尿布']]
# 将交易数据转换成编码形式
te = TransactionEncoder()
te_ary = te.fit(data).transform(data)
# 使用Apriori算法发现频繁项集
frequent_itemsets = apriori(te_ary, min_support=0.6, use_colnames=True)
# 从频繁项集中提取关联规则
rules = association_rules(frequent_itemsets, metric="lift", min_threshold=1)
print(rules)
```
在这个例子中,`min_support`参数设置了支持度阈值(比如60%),`min_threshold`用于设置置信度阈值(比如1)。运行这段代码会显示出哪些商品组合满足这两个条件,并且它们之间有较高的关联度。
阅读全文