举个例子说明如何在实际项目中应用fp-growth库?
时间: 2024-10-27 08:09:58 浏览: 8
FP-Growth(频繁模式挖掘算法的一种变体)常用于数据挖掘领域,特别是关联规则学习,比如在市场篮子分析中发现顾客购买商品之间的规律。在实际项目中,你可以使用Python的mlxtend库中的FPGrowth类来应用它。这里是一个简单的例子:
```python
from mlxtend.preprocessing import TransactionEncoder
from mlxtend.frequent_patterns import fpgrowth
# 假设我们有如下的购物记录数据
transactions = [['Milk', 'Bread'], ['Bread', 'Butter', 'Eggs'], ['Milk', 'Butter'], ['Milk', 'Bread', 'Butter']]
# 将交易列表编码成数值表
te = TransactionEncoder()
te_ary = te.fit(transactions).transform(transactions)
# 使用FPGrowth找到支持度大于50%的频繁项集
min_support = 0.5
frequent_itemsets = fpgrowth(te_ary, min_support)
# 打印频繁项集和对应的规则
for itemset, freq in frequent_itemsets.items():
if freq[1] == min_support:
print(f"项集:{itemset}, 支持度:{freq[1]}")
```
在这个例子中,我们首先对交易数据进行编码,然后通过`fpgrowth`函数找出频繁项集。最后,我们筛选出那些支持度达到预设阈值(例如50%)的规则。
阅读全文