用python代码完成Apriori算法对products数据集的关联规则挖掘
时间: 2023-12-21 08:06:30 浏览: 85
Apriori算法是一种用于挖掘数据集中频繁项集的算法,从而发现不同项之间的关联规则。下面是使用Apriori算法对products数据集进行关联规则挖掘的Python代码实现:
```python
import pandas as pd
from mlxtend.frequent_patterns import apriori
from mlxtend.frequent_patterns import association_rules
# 读取数据集
data = pd.read_csv('products.csv', header=None)
data.columns = ['product1', 'product2', 'product3', 'product4', 'product5']
# 将数据集转化为0/1矩阵
data = pd.get_dummies(data)
# 使用Apriori算法挖掘频繁项集
frequent_itemsets = apriori(data, min_support=0.1, use_colnames=True)
# 根据频繁项集和置信度挖掘关联规则
rules = association_rules(frequent_itemsets, metric="confidence", min_threshold=0.5)
# 输出结果
print(rules)
```
上述代码中,我们使用了pandas库读取了名为"products.csv"的数据集,然后将其转化为0/1矩阵。接着使用mlxtend库中的apriori函数挖掘频繁项集,设置最小支持度为0.1。最后使用association_rules函数根据频繁项集和置信度挖掘关联规则,设置最小置信度为0.5。最终得到的结果是符合条件的关联规则。
阅读全文