关联规则挖掘算法python代码
时间: 2024-10-12 14:03:41 浏览: 43
Apriori算法,一种寻找关联规则 的数据挖掘算法_python_代码_下载
5星 · 资源好评率100%
关联规则挖掘算法是一种数据挖掘技术,主要用于发现数据集中项之间的有趣关联,如频繁购买的商品组合。Python有许多库可以支持这个过程,比如Apriori、Frequent Itemset Miner等,最常用的是`mlxtend`和`pyfim`。
下面是使用`mlxtend`库(它基于`apyori`)的一个简单示例,演示如何执行Apriori算法找到频繁项集:
```python
from mlxtend.preprocessing import TransactionEncoder
from mlxtend.frequent_patterns import apriori, association_rules
# 假设我们有如下交易数据
transactions = [['Milk', 'Bread', 'Eggs'], ['Bread', 'Butter'], ['Milk', 'Cheese']]
# 将字符串转换为整数编码
te = TransactionEncoder()
te_ary = te.fit(transactions).transform(transactions)
# 创建DataFrame并设置索引
df = pd.DataFrame(te_ary, columns=te.columns_)
df.index += 1
# 找到频繁项集(支持度默认为0.6)
frequent_itemsets = apriori(df, min_support=0.6, use_colnames=True)
# 计算关联规则,并选择置信度大于0.7的规则
rules = association_rules(frequent_itemsets, metric="confidence", min_threshold=0.7)
print("关联规则:")
print(rules)
```
阅读全文