以python实现Apriori算法,对购物篮里的数据进行分析
时间: 2023-02-24 21:48:53 浏览: 427
Apriori算法是一种常用于数据挖掘的关联规则算法,用于发现物品之间的关联规则。
要在Python中实现Apriori算法,您需要使用支持库,例如mlxtend,您也可以自己编写代码。
下面是使用mlxtend库的代码示例:
```
!pip install mlxtend
from mlxtend.preprocessing import TransactionEncoder
from mlxtend.frequent_patterns import apriori
dataset = [['Milk', 'Onion', 'Nutmeg', 'Kidney Beans', 'Eggs', 'Yogurt'],
['Dill', 'Onion', 'Nutmeg', 'Kidney Beans', 'Eggs', 'Yogurt'],
['Milk', 'Apple', 'Kidney Beans', 'Eggs'],
['Milk', 'Unicorn', 'Corn', 'Kidney Beans', 'Yogurt'],
['Corn', 'Onion', 'Onion', 'Kidney Beans', 'Ice cream', 'Eggs']]
te = TransactionEncoder()
te_ary = te.fit(dataset).transform(dataset)
df = pd.DataFrame(te_ary, columns=te.columns_)
frequent_itemsets = apriori(df, min_support=0.6, use_colnames=True)
```
在这个代码中,我们将购物篮里的数据作为一个交易数据集,使用`TransactionEncoder`类将数据转换为0/1矩阵,然后使用`apriori`函数找出频繁项集。
最后,您可以通过分析频繁项集来了解数据中物品之间的关联规则。
阅读全文