from apriori import * # 编写代码实现关联规则抽取 dataset = load_data('data/apriori.txt') # 定义 generate_big_rules函数来获取关联规则 def generate_big_rules(L, support_data, min_conf): big_rule_list = [] sub_set_list = [] for i in range(0, len(L)): for freq_set in L[i]: # freq_set:('B4')、('B4', 'C4', 'H4') for sub_set in sub_set_list: #**************** BEGIN ***************** if sub_set.issubset(freq_set): # 计算置信度 # 前件、后件、支持度、置信度 #**************** END ******************* sub_set_list.append(freq_set) return big_rule_list def task(): L, support_data = generate_L(dataset, k=4, min_support=0.06) # 根据频繁项集寻找关联规则,设置置信度为 0.75 big_rules_list = generate_big_rules(L, support_data, min_conf=0.75) return big_rules_list
时间: 2023-07-19 18:55:35 浏览: 120
使用Apriori算法进行频繁项集的挖掘以及关联规则的挖掘
这段代码的功能是实现关联规则抽取,具体步骤如下:
1. 使用apriori.py中的load_data方法从文件中读入经过离散化处理后的数据集。
2. 定义generate_big_rules函数来获取关联规则。该函数的输入参数包括频繁项集L、支持度信息support_data和最小置信度min_conf。
3. 在函数中,通过两层循环遍历频繁项集L,对于每个频繁项freq_set,再遍历它的子集sub_set_list,判断子集是否是freq_set的子集,如果是,则计算置信度并保存关联规则。
4. 最后返回关联规则列表big_rule_list。
5. 在task函数中,调用generate_L方法得到频繁项集L和支持度信息support_data,然后调用generate_big_rules方法得到关联规则列表big_rules_list,并将其作为返回值。
需要注意的是,该代码中的generate_L函数没有给出,因此可能需要在其他地方进行定义。
阅读全文