Apriori 算法操作数据集代码
时间: 2023-12-26 18:05:40 浏览: 76
以下是一个利用 Apriori 算法实现的 Python 代码:
```python
# 导入需要的库
import pandas as pd
from mlxtend.preprocessing import TransactionEncoder
from mlxtend.frequent_patterns import apriori, association_rules
# 创建数据集
dataset = [['牛奶', '面包', '尿布'],
['可乐', '面包', '尿布', '啤酒'],
['牛奶', '尿布', '啤酒', '鸡蛋'],
['尿布', '可乐', '牛奶', '面包'],
['面包', '牛奶', '尿布', '啤酒']]
# 对数据集进行编码
te = TransactionEncoder()
te_ary = te.fit(dataset).transform(dataset)
df = pd.DataFrame(te_ary, columns=te.columns_)
# 使用 Apriori 算法找到频繁项集
frequent_itemsets = apriori(df, min_support=0.6, use_colnames=True)
# 根据频繁项集生成关联规则
rules = association_rules(frequent_itemsets, metric="confidence", min_threshold=0.7)
# 输出频繁项集和关联规则
print("Frequent Itemsets:\n", frequent_itemsets)
print("\nAssociation Rules:\n", rules)
```
在这个代码中,我们首先创建了一个数据集,然后使用 `TransactionEncoder` 对数据集进行编码,使其可以被 Apriori 算法处理。随后,我们使用 `apriori` 函数找到频繁项集,然后使用 `association_rules` 函数生成关联规则。最后,我们输出了频繁项集和关联规则。
阅读全文