关联规则挖掘的Python代码
时间: 2023-11-05 16:08:57 浏览: 95
数据挖掘大作业-基于python实现关联规则挖掘可视化系统+源代码+文档说明
关联规则挖掘是一种数据挖掘技术,可以用于分析大规模数据集中的关联关系。下面是使用Python实现关联规则挖掘的示例代码:
```python
# 导入必要的库
import pandas as pd
from mlxtend.frequent_patterns import apriori
from mlxtend.frequent_patterns import association_rules
# 读取数据
data = pd.read_csv('data.csv')
# 进行独热编码
data = pd.get_dummies(data)
# 通过Apriori算法挖掘频繁项集
frequent_itemsets = apriori(data, min_support=0.05, use_colnames=True)
# 通过关联规则算法挖掘关联规则
rules = association_rules(frequent_itemsets, metric="lift", min_threshold=1)
# 按照提升度降序排列规则
rules = rules.sort_values(['lift'], ascending=False)
# 打印前10条规则
print(rules.head(10))
```
在上面的代码中,`data.csv`是包含数据的CSV文件。首先,我们使用`pandas`库将数据读入DataFrame对象中。然后,我们使用`get_dummies()`函数进行独热编码。接下来,我们使用`apriori()`函数找出频繁项集,并使用`association_rules()`函数找出关联规则。最后,我们使用`sort_values()`函数按照提升度降序排列规则,并打印前10条规则。
需要注意的是,`mlxtend`库需要额外安装,可以使用`pip install mlxtend`命令进行安装。
阅读全文