python写的关联规则算法实例

时间: 2023-10-24 10:21:26 浏览: 97

Efficient-Apriori:Apriori算法的高效Python实现

以下是一个简单的 Python 实现 Apriori 关联规则算法的示例代码： ```python def create_C1(data_set): """ 生成候选项集 C1 :param data_set: 数据集 :return: 候选项集 C1 """ C1 = [] for transaction in data_set: for item in transaction: if [item] not in C1: C1.append([item]) C1.sort() return list(map(frozenset, C1)) def scan_D(D, Ck, min_support): """ 计算候选项集 Ck 中的项集在数据集 D 中的支持度，并返回支持度大于等于 min_support 的项集 :param D: 数据集 :param Ck: 候选项集 :param min_support: 最小支持度 :return: 支持度大于等于 min_support 的项集，以及所有项集的支持度字典 """ ss_cnt = {} for tid in D: for can in Ck: if can.issubset(tid): ss_cnt[can] = ss_cnt.get(can, 0) + 1 num_items = float(len(D)) ret_list = [] support_data = {} for key in ss_cnt: support = ss_cnt[key] / num_items if support >= min_support: ret_list.insert(0, key) support_data[key] = support return ret_list, support_data def apriori_gen(Lk, k): """ 根据频繁项集 Lk 生成候选项集 Ck+1 :param Lk: 频繁项集 Lk :param k: 项集大小 :return: 候选项集 Ck+1 """ ret_list = [] len_Lk = len(Lk) for i in range(len_Lk): for j in range(i + 1, len_Lk): L1 = list(Lk[i])[:k - 2] L2 = list(Lk[j])[:k - 2] L1.sort() L2.sort() if L1 == L2: ret_list.append(Lk[i] | Lk[j]) return ret_list def apriori(data_set, min_support=0.5): """ Apriori 算法主函数 :param data_set: 数据集 :param min_support: 最小支持度 :return: 所有频繁项集，以及所有项集的支持度字典 """ C1 = create_C1(data_set) D = list(map(set, data_set)) L1, support_data = scan_D(D, C1, min_support) L = [L1] k = 2 while len(L[k - 2]) > 0: Ck = apriori_gen(L[k - 2], k) Lk, sup_k = scan_D(D, Ck, min_support) support_data.update(sup_k) L.append(Lk) k += 1 return L, support_data def generate_rules(L, support_data, min_confidence=0.7): """ 根据频繁项集及其支持度字典，生成关联规则 :param L: 频繁项集列表 :param support_data: 支持度字典 :param min_confidence: 最小置信度 :return: 满足最小置信度的关联规则 """ big_rule_list = [] for i in range(1, len(L)): for freq_set in L[i]: H1 = [frozenset([item]) for item in freq_set] if i > 1: rules_from_conseq(freq_set, H1, support_data, big_rule_list, min_confidence) else: calc_confidence(freq_set, H1, support_data, big_rule_list, min_confidence) return big_rule_list def calc_confidence(freq_set, H, support_data, brl, min_confidence=0.7): """ 计算置信度并筛选出满足最小置信度要求的关联规则 :param freq_set: 频繁项集 :param H: 可出现在规则右部的项集列表 :param support_data: 支持度字典 :param brl: 关联规则列表 :param min_confidence: 最小置信度 """ pruned_h = [] for conseq in H: conf = support_data[freq_set] / support_data[freq_set - conseq] if conf >= min_confidence: print(freq_set - conseq, '-->', conseq, 'conf:', conf) brl.append((freq_set - conseq, conseq, conf)) pruned_h.append(conseq) return pruned_h def rules_from_conseq(freq_set, H, support_data, brl, min_confidence=0.7): """ 根据当前规则右部的项集列表，生成新的候选规则右部的项集列表 :param freq_set: 频繁项集 :param H: 可出现在规则右部的项集列表 :param support_data: 支持度字典 :param brl: 关联规则列表 :param min_confidence: 最小置信度 """ m = len(H[0]) if len(freq_set) > (m + 1): Hmp1 = apriori_gen(H, m + 1) Hmp1 = calc_confidence(freq_set, Hmp1, support_data, brl, min_confidence) if len(Hmp1) > 1: rules_from_conseq(freq_set, Hmp1, support_data, brl, min_confidence) ``` 以上代码实现了 Apriori 算法的主要功能，包括生成候选项集、计算支持度、生成频繁项集、计算置信度、生成关联规则等。通过调用 `apriori()` 函数和 `generate_rules()` 函数，可以得到所有频繁项集和满足最小置信度要求的关联规则。

阅读全文

python写的关联规则算法实例

相关推荐

Python商业数据分析：关联规则与Apriori算法

Python实现机器学习算法实战详解

python apriori算法实例

用python语言编写一个关联规则算法实例并进行描述

python实现关联规则实例

关联规则Python实例

编写一个关联规则算法的实例并出代码

python应用Apriori算法实例

编写一个关联规则算法的实例并出结果和代码

untitled_关联规则算法_Apriori_Apriori改进_Untitled_

python数据分析实例代码 - 中医证型关联规则挖掘.rar

中医证型关联规则挖掘：Python数据分析实例代码解析

数据挖掘：关联规则挖掘实例与电信业营销策略

Python在机器学习算法中的应用实例

Python中的关联规则挖掘实战分析

数据挖掘入门：Python中的关联规则挖掘

运用Python使用Apriori算法对数据集提取关联规则

fpgrouwth算法Python实例

Python实现机器学习算法实战教程

最新推荐

白色大气风格的旅游酒店企业网站模板.zip

python实现用户注册

【图像压缩】基于matlab GUI Haar小波变换图像压缩（含PSNR）【含Matlab源码 9979期】.zip

RStudio中集成Connections包以优化数据库连接管理

管理建模和仿真的文件

Keil uVision5全面精通指南

flink提交给yarn19个全量同步MYsqlCDC的作业，flink的配置参数怎样设置

PHP博客旅游的探索之旅

"互动学习：行动中的多样性与论文攻读经历"

【单片机编程实战】：掌握流水灯与音乐盒同步控制的高级技巧