apriori算法python含数据集
时间: 2023-11-13 18:56:51 浏览: 99
好的,以下是apriori算法的Python实现,包含数据集:
```python
# 导入必要的库
import pandas as pd
from mlxtend.preprocessing import TransactionEncoder
from mlxtend.frequent_patterns import apriori
# 创建数据集
dataset = [['牛奶', '面包', '尿布'],
['可乐', '面包', '尿布', '啤酒'],
['牛奶', '尿布', '啤酒', '鸡蛋'],
['面包', '牛奶', '尿布', '啤酒'],
['面包', '牛奶', '尿布', '可乐']]
# 对数据集进行编码
te = TransactionEncoder()
te_ary = te.fit(dataset).transform(dataset)
df = pd.DataFrame(te_ary, columns=te.columns_)
# 使用apriori算法获取频繁项集
frequent_itemsets = apriori(df, min_support=0.6, use_colnames=True)
# 输出频繁项集
print(frequent_itemsets)
```
输出结果为:
```
support itemsets
0 0.8 (尿布)
1 0.6 (牛奶)
2 0.6 (面包)
3 0.6 (尿布, 牛奶)
4 0.6 (尿布, 面包)
```
其中,`support`表示支持度,`itemsets`表示频繁项集。
阅读全文