python关联规则挖掘
时间: 2023-07-09 20:42:25 浏览: 119
关联规则挖掘
5星 · 资源好评率100%
关联规则挖掘是一种数据挖掘技术,可以用于发现数据之间的关联关系。在Python中,可以使用`mlxtend`库来挖掘关联规则。具体步骤如下:
1. 安装`mlxtend`库
```python
!pip install mlxtend
```
2. 导入库并读取数据
```python
import pandas as pd
from mlxtend.preprocessing import TransactionEncoder
# 读取数据
data = [['牛奶', '面包', '尿布'],
['可乐', '面包', '尿布', '啤酒'],
['牛奶', '尿布', '啤酒', '鸡蛋'],
['面包', '牛奶', '尿布', '啤酒'],
['面包', '牛奶', '尿布', '可乐']]
# 转换数据格式
te = TransactionEncoder()
te_ary = te.fit(data).transform(data)
df = pd.DataFrame(te_ary, columns=te.columns_)
```
3. 挖掘关联规则
```python
from mlxtend.frequent_patterns import apriori
from mlxtend.frequent_patterns import association_rules
# 挖掘频繁项集
frequent_itemsets = apriori(df, min_support=0.6, use_colnames=True)
# 挖掘关联规则
rules = association_rules(frequent_itemsets, metric="confidence", min_threshold=0.7)
```
在上述代码中,`min_support`表示支持度阈值,`use_colnames`表示使用原始数据中的列名,`metric`表示评估关联规则的指标,`min_threshold`表示置信度阈值。最终得到的`rules`即为挖掘出的关联规则。
阅读全文