完成Apriori算法对products数据集的关联规则挖掘
时间: 2023-07-09 14:43:24 浏览: 103
基于Apriori算法的关联规则挖掘
好的,以下是使用 Apriori 算法对 "products.csv" 数据集进行关联规则挖掘的 Python 代码:
```python
import pandas as pd
from mlxtend.frequent_patterns import apriori
from mlxtend.frequent_patterns import association_rules
# 读取数据集
data = pd.read_csv('products.csv', header=None)
# 将数据集转换为适合进行关联规则挖掘的格式
def encode_units(x):
if x <= 0:
return 0
if x >= 1:
return 1
data_sets = data.applymap(encode_units)
# 挖掘频繁项集,最小支持度为0.1
frequent_itemsets = apriori(data_sets, min_support=0.1, use_colnames=True)
# 根据频繁项集计算关联规则,设置最小提升度为2
rules = association_rules(frequent_itemsets, metric="lift", min_threshold=2)
# 输出关联规则
print(rules)
```
这段代码与之前的代码非常相似,只是将数据集文件的读取改为了直接读取名为 "products.csv" 的文件。运行代码后,将会输出关联规则,这些规则将根据频繁项集和最小提升度进行计算。您可以根据需要对 `min_support` 和 `min_threshold` 进行调整,以便得到最适合您数据集的关联规则。
阅读全文