大数据挖掘中 关联规则挖掘的用法 给出代码
时间: 2024-05-10 14:13:45 浏览: 9
关联规则挖掘是一种常见的大数据挖掘技术,用于发现不同数据项之间的关联规律。以下是一个用Python实现的简单代码示例:
```python
import pandas as pd
from mlxtend.preprocessing import TransactionEncoder
from mlxtend.frequent_patterns import apriori
# 读取数据集
dataset = [['A', 'B', 'C'], ['B', 'C', 'D'], ['A', 'C', 'E'], ['B', 'D', 'E'], ['A', 'C', 'D']]
te = TransactionEncoder()
te_ary = te.fit_transform(dataset)
df = pd.DataFrame(te_ary, columns=te.columns_)
# 挖掘频繁项集
frequent_itemsets = apriori(df, min_support=0.6, use_colnames=True)
# 挖掘关联规则
from mlxtend.frequent_patterns import association_rules
rules = association_rules(frequent_itemsets, metric="confidence", min_threshold=0.7)
print(rules)
```
该代码使用了mlxtend库,它提供了方便易用的实现关联规则挖掘的函数。其中,TransactionEncoder用于将原始数据转换为一种适合挖掘的格式,apriori函数用于挖掘频繁项集,association_rules则用于从频繁项集中挖掘出关联规则。在以上代码中,我们设定了最小支持度为0.6,最小置信度为0.7,即只要项集出现的频率大于等于0.6,且规则被满足的比例大于等于0.7,就认为它们是有关联的。