python写的关联规则算法实例

时间: 2023-10-24 22:21:26 浏览: 31
以下是一个简单的 Python 实现 Apriori 关联规则算法的示例代码: ```python def create_C1(data_set): """ 生成候选项集 C1 :param data_set: 数据集 :return: 候选项集 C1 """ C1 = [] for transaction in data_set: for item in transaction: if [item] not in C1: C1.append([item]) C1.sort() return list(map(frozenset, C1)) def scan_D(D, Ck, min_support): """ 计算候选项集 Ck 中的项集在数据集 D 中的支持度,并返回支持度大于等于 min_support 的项集 :param D: 数据集 :param Ck: 候选项集 :param min_support: 最小支持度 :return: 支持度大于等于 min_support 的项集,以及所有项集的支持度字典 """ ss_cnt = {} for tid in D: for can in Ck: if can.issubset(tid): ss_cnt[can] = ss_cnt.get(can, 0) + 1 num_items = float(len(D)) ret_list = [] support_data = {} for key in ss_cnt: support = ss_cnt[key] / num_items if support >= min_support: ret_list.insert(0, key) support_data[key] = support return ret_list, support_data def apriori_gen(Lk, k): """ 根据频繁项集 Lk 生成候选项集 Ck+1 :param Lk: 频繁项集 Lk :param k: 项集大小 :return: 候选项集 Ck+1 """ ret_list = [] len_Lk = len(Lk) for i in range(len_Lk): for j in range(i + 1, len_Lk): L1 = list(Lk[i])[:k - 2] L2 = list(Lk[j])[:k - 2] L1.sort() L2.sort() if L1 == L2: ret_list.append(Lk[i] | Lk[j]) return ret_list def apriori(data_set, min_support=0.5): """ Apriori 算法主函数 :param data_set: 数据集 :param min_support: 最小支持度 :return: 所有频繁项集,以及所有项集的支持度字典 """ C1 = create_C1(data_set) D = list(map(set, data_set)) L1, support_data = scan_D(D, C1, min_support) L = [L1] k = 2 while len(L[k - 2]) > 0: Ck = apriori_gen(L[k - 2], k) Lk, sup_k = scan_D(D, Ck, min_support) support_data.update(sup_k) L.append(Lk) k += 1 return L, support_data def generate_rules(L, support_data, min_confidence=0.7): """ 根据频繁项集及其支持度字典,生成关联规则 :param L: 频繁项集列表 :param support_data: 支持度字典 :param min_confidence: 最小置信度 :return: 满足最小置信度的关联规则 """ big_rule_list = [] for i in range(1, len(L)): for freq_set in L[i]: H1 = [frozenset([item]) for item in freq_set] if i > 1: rules_from_conseq(freq_set, H1, support_data, big_rule_list, min_confidence) else: calc_confidence(freq_set, H1, support_data, big_rule_list, min_confidence) return big_rule_list def calc_confidence(freq_set, H, support_data, brl, min_confidence=0.7): """ 计算置信度并筛选出满足最小置信度要求的关联规则 :param freq_set: 频繁项集 :param H: 可出现在规则右部的项集列表 :param support_data: 支持度字典 :param brl: 关联规则列表 :param min_confidence: 最小置信度 """ pruned_h = [] for conseq in H: conf = support_data[freq_set] / support_data[freq_set - conseq] if conf >= min_confidence: print(freq_set - conseq, '-->', conseq, 'conf:', conf) brl.append((freq_set - conseq, conseq, conf)) pruned_h.append(conseq) return pruned_h def rules_from_conseq(freq_set, H, support_data, brl, min_confidence=0.7): """ 根据当前规则右部的项集列表,生成新的候选规则右部的项集列表 :param freq_set: 频繁项集 :param H: 可出现在规则右部的项集列表 :param support_data: 支持度字典 :param brl: 关联规则列表 :param min_confidence: 最小置信度 """ m = len(H[0]) if len(freq_set) > (m + 1): Hmp1 = apriori_gen(H, m + 1) Hmp1 = calc_confidence(freq_set, Hmp1, support_data, brl, min_confidence) if len(Hmp1) > 1: rules_from_conseq(freq_set, Hmp1, support_data, brl, min_confidence) ``` 以上代码实现了 Apriori 算法的主要功能,包括生成候选项集、计算支持度、生成频繁项集、计算置信度、生成关联规则等。通过调用 `apriori()` 函数和 `generate_rules()` 函数,可以得到所有频繁项集和满足最小置信度要求的关联规则。

相关推荐

最新推荐

GDAL-3.6.2-cp310-cp310-win32.whl.zip

GDAL-3.6.2-cp310-cp310-win32.whl.zip

scipy-1.3.2-cp36-cp36m-manylinux1_x86_64.whl

py依赖包

一个黑暗的房间-一个极简主义的文字冒险.zip

一个黑暗的房间-一个极简主义的文字冒险.zip

scipy-1.3.3-cp37-cp37m-manylinux1_i686.whl

py依赖包

scipy-1.3.2-cp37-cp37m-macosx_10_6_intel.whl

py依赖包

步行高级机器人技术.doc

步行高级机器人技术.doc

管理建模和仿真的文件

管理Boualem Benatallah引用此版本:布阿利姆·贝纳塔拉。管理建模和仿真。约瑟夫-傅立叶大学-格勒诺布尔第一大学,1996年。法语。NNT:电话:00345357HAL ID:电话:00345357https://theses.hal.science/tel-003453572008年12月9日提交HAL是一个多学科的开放存取档案馆,用于存放和传播科学研究论文,无论它们是否被公开。论文可以来自法国或国外的教学和研究机构,也可以来自公共或私人研究中心。L’archive ouverte pluridisciplinaire

粒子群多目标算法matlab代码【MATLAB代码实现】定义优化问题参数

# 1. 粒子群多目标算法简介 ## 1.1 什么是粒子群算法? 粒子群算法是一种基于群体智能的优化算法,灵感来源于鸟群或鱼群等生物群体的行为。每个“粒子”代表问题空间中的一个候选解,而整个粒子群代表了候选解的一个群体。粒子在解空间中搜索最优解,通过个体的经验和群体的协作来不断调整自身位置和速度,从而逐步靠近最优解。 ## 1.2 粒子群算法在多目标优化中的应用 粒子群算法最初是针对单目标优化问题提出的,但后来被扩展应用到了多目标优化领域。与单目标优化不同,多目标优化需要考虑多个冲突的目标函数,因此粒子群算法的应用在多目标优化中具有一定的挑战性。 ## 1.3 粒子群多目标算法原理解

c语言本题要求编写程序,计算学生们的平均成绩,并统计不及格人数。题目保证输入输出均在整型范围内。

好的,下面是一个简单的 C 语言程序,可以帮助你计算学生们的平均成绩,并统计不及格人数: ```c #include <stdio.h> int main() { int n, sum = 0, fail = 0; scanf("%d", &n); // 输入学生数量 for (int i = 0; i < n; i++) { int score; scanf("%d", &score); // 输入学生的成绩 sum += score; // 累加学生的成绩 if (score < 60) {

资料计算机二级Python真题及答案解析1练习.pdf

。。。