假设有以下数据集，每行代表一个顾客在超市的购买记录： I1: 西红柿、排骨、鸡蛋 I2: 西红柿、茄子 I3: 鸡蛋、袜子 I4: 西红柿、排骨、茄子 I5: 西红柿、排骨、袜子、酸奶 I6: 鸡蛋、茄子、酸奶 I7: 排骨、鸡蛋、茄子 I8: 土豆、鸡蛋、袜子 I9: 西红柿、排骨、鞋子、土豆请同学们编程完成以下2项操作：（1）将以上数据转换为如下图所示的布尔（0，1）值数据集，如下表所示： ID 土豆排骨茄子袜子西红柿酸奶鞋子鸡蛋 I1 0 1 0 0 1 0 0 1 I2 0 0 1 0 1 0 0 0 I3 0 0 0 1 0 0 0 1 I4 0 1 1 0 1 0 0 0 I5 0 1 0 1 1 1 0 0 I6 0 0 1 0 0 1 0 1 I7 0 1 1 0 0 0 0 1 I8 1 0 0 1 0 0 0 1 I9 1 1 0 0 1 0 1 0 （2）完成2项之间的关联规则的计算，关联规则定义如下：假如有一条规则：西红柿—>排骨，则同时购买西红柿和排骨的顾客比例为4/9，而购买西红柿的顾客当中也购买了排骨的比例是4/5。这两个比例参数在关联规则中是非常有意义的度量，分别称作支持度（support）和置信度（confidence）。支持度反应了规则的覆盖范围，置信度反应了规则的可信程度。计算结果应该如下图所示： support confidence 西红柿---排骨 0.444444 0.800000 排骨---西红柿 0.444444 0.800000 袜子---鸡蛋 0.222222 0.666667 茄子---排骨 0.222222 0.500000 茄子---西红柿 0.222222 0.500000 茄子---鸡蛋 0.222222 0.500000

时间: 2024-01-02 08:04:24 浏览: 226

超市数据集

3星 · 编辑精心推荐

好的，我可以帮你完成这个任务。以下是 Python 代码实现： ## 将数据转换为布尔（0，1）值数据集 dataset = { 'I1': {'西红柿': 1, '排骨': 1, '鸡蛋': 1}, 'I2': {'西红柿': 1, '茄子': 1}, 'I3': {'鸡蛋': 1, '袜子': 1}, 'I4': {'西红柿': 1, '排骨': 1, '茄子': 1}, 'I5': {'西红柿': 1, '排骨': 1, '袜子': 1, '酸奶': 1}, 'I6': {'鸡蛋': 1, '茄子': 1, '酸奶': 1}, 'I7': {'排骨': 1, '茄子': 1, '鸡蛋': 1}, 'I8': {'土豆': 1, '鸡蛋': 1, '袜子': 1}, 'I9': {'西红柿': 1, '排骨': 1, '土豆': 1, '鞋子': 1} } ## 统计所有物品的出现次数 item_counts = {} for transaction in dataset.values(): for item in transaction.keys(): if item not in item_counts: item_counts[item] = 0 item_counts[item] += 1 ## 构建布尔矩阵 bool_matrix = {} for transaction_id, transaction in dataset.items(): bool_matrix[transaction_id] = {} for item, count in item_counts.items(): if item in transaction: bool_matrix[transaction_id][item] = 1 else: bool_matrix[transaction_id][item] = 0 ## 输出布尔矩阵 print('ID\t', end='') for item in item_counts.keys(): print(item, '\t', end='') print() for transaction_id, transaction in bool_matrix.items(): print(transaction_id, '\t', end='') for item in item_counts.keys(): print(transaction[item], '\t', end='') print() ## 计算关联规则 min_support = 2 ## 最小支持度 min_confidence = 0.5 ## 最小置信度 ## 统计所有项集的支持度 itemsets_counts = {} for transaction in bool_matrix.values(): for itemset in range(1, len(item_counts) + 1): for items in itertools.combinations(item_counts.keys(), itemset): if all([transaction[item] == 1 for item in items]): if items not in itemsets_counts: itemsets_counts[items] = 0 itemsets_counts[items] += 1 ## 计算关联规则的支持度和置信度 rules = [] for itemset in itemsets_counts.keys(): if len(itemset) > 1: for subset in itertools.combinations(itemset, len(itemset) - 1): antecedent = subset consequent = tuple(sorted(set(itemset) - set(subset))) support = itemsets_counts[itemset] / len(bool_matrix) confidence = itemsets_counts[itemset] / itemsets_counts[antecedent] if support >= min_support and confidence >= min_confidence: rules.append((antecedent, consequent, support, confidence)) ## 输出关联规则 print('关联规则\t\t', 'support\t', 'confidence') for rule in rules: print(str(rule[0]) + '---' + str(rule[1]), '\t', round(rule[2], 6), '\t', round(rule[3], 6))

阅读全文

相关推荐

超市数据分析-数据集

基于R语言实现超市数据关联规则分析

当然可以！以下是一些简单又美味的鸡蛋菜谱，供你参考：\n\n### 1. 西红柿炒鸡蛋\n材料：\n- 鸡蛋 3个\n- 西红柿 2个\n- 盐 适量\n- 糖 适量\n- 葱 适量\n- 食用油 适量\n\n做法：\n1. 西红柿洗净 写一个方法给这段字符串转成html

用html写一个有以下几个选项：西红柿、鸡蛋、米饭、葱、面 请随机选择几种食材，生成对应食物

用vue3写一个要求有以下几个选项：西红柿、鸡蛋、米饭、葱、面 请随机选择几种食材，生成对应食物

超市关联规则数据集.rar

蔬菜分类图像数据集，包含：豆子、苦瓜、冬瓜、茄子、西兰花、卷心菜、辣椒、胡萝卜、花椰菜、黄瓜、木瓜、土豆、南瓜、萝卜和西红柿

Jupyter_关于长期序列预测NeurIPS 2021的自耦分解变压器的代码发布.zip

考研公共课历年真题集-最新发布.zip

最新推荐

Jupyter_关于长期序列预测NeurIPS 2021的自耦分解变压器的代码发布.zip

高清艺术文字图标资源，PNG和ICO格式免费下载

管理建模和仿真的文件

DMA技术：绕过CPU实现高效数据传输

SGM8701电压比较器如何在低功耗电池供电系统中实现高效率运作？

mui框架HTML5应用界面组件使用示例教程

"互动学习：行动中的多样性与论文攻读经历"

【数据传输高速公路】：总线系统的深度解析

如何结合PID算法调整PWM信号来优化电机速度控制？请提供实现这一过程的步骤和代码示例。

Vue.js开发利器：chrome-vue-devtools插件解析

当然可以！以下是一些简单又美味的鸡蛋菜谱，供你参考：\n\n### 1. 西红柿炒鸡蛋\n材料：\n- 鸡蛋 3个\n- 西红柿 2个\n- 盐适量\n- 糖适量\n- 葱适量\n- 食用油适量\n\n做法：\n1. 西红柿洗净写一个方法给这段字符串转成html

用html写一个有以下几个选项：西红柿、鸡蛋、米饭、葱、面请随机选择几种食材，生成对应食物

用vue3写一个要求有以下几个选项：西红柿、鸡蛋、米饭、葱、面请随机选择几种食材，生成对应食物