提供FP-Growth算法的Python代码实现
时间: 2024-10-24 16:14:05 浏览: 52
FP-Growth(频繁模式增长)是一种用于挖掘关联规则的算法,它主要用于发现数据集中的频繁项集。以下是使用Python实现FP-Growth算法的一个简化版代码示例,使用了mlxtend库中的`fpgrowth`模块:
```python
from mlxtend.preprocessing import TransactionEncoder
from mlxtend.frequent_patterns import fpgrowth
# 假设这是你的交易数据,每一行代表一次购买行为,每个元素是一个商品ID
transactions = [['Milk', 'Eggs', 'Bread'],
['Bread', 'Butter'],
['Eggs', 'Milk', 'Butter', 'Coffee'],
['Milk', 'Bread', 'Butter']]
# 转换为事务列表格式
te = TransactionEncoder()
X = te.fit(transactions).transform(transactions)
# 设置最小支持度阈值(例如50%)
min_support = len(X) / 2
# 使用FP-Growth算法找出频繁项集
freq_set = fpgrowth(X, min_support=min_support, use_colnames=True)
print("频繁项集:")
for itemset, support in freq_set['itemsets']:
print(f"项目:{list(itemset)},支持度:{support}")
阅读全文