(1)设最小支持度阈值为40%和最小置信度阈值为70%,使用apyori库进行频繁项分析,并输出频繁项集及其支持度以及规则
时间: 2024-03-08 15:45:59 浏览: 78
以下是使用apyori库进行频繁项分析的Python代码示例,使用的数据集为示例数据集:
```python
# 导入相关库
import pandas as pd
from apyori import apriori
# 读取数据集
data = pd.read_excel('data.xlsx', header=None)
# 将数据集转换成列表格式
records = []
for i in range(len(data)):
records.append([str(data.values[i, j]) for j in range(len(data.columns))])
# 执行频繁项分析
frequent_itemsets = apriori(records, min_support=0.4, min_confidence=0.7, min_lift=1, min_length=2)
# 输出频繁项集及其支持度
for itemset in frequent_itemsets:
print(itemset.items, itemset.support)
# 输出规则及其置信度和提升度
for itemset in frequent_itemsets:
for rule in itemset.ordered_statistics:
print(rule.items_base, '->', rule.items_add, rule.confidence, rule.lift)
```
其中,`records`是数据集转换成的序列列表,`apriori`函数执行频繁项分析,可以设置最小支持度阈值(`min_support`)、最小置信度阈值(`min_confidence`)、最小提升度阈值(`min_lift`)和最小项集长度(`min_length`)等参数。最后,使用for循环输出频繁项集及其支持度,以及规则及其置信度和提升度。
阅读全文