创建强关联规则的样本数据集

强关联规则是一种用于发现数据集中项集之间相关性的算法。创建强关联规则的样本数据集可以采取以下步骤： 1. 确定数据集：选择一个数据集，该数据集应包含多个项集。例如，可以选择一个包含多个产品的购物篮数据集。 2. 确定支持度和置信度的阈值：支持度是指包含某个项集的所有交易的比率，置信度是指在包含某个项集的交易中同时包含另一个项集的比率。可以根据数据集的实际情况选择合适的阈值。 3. 根据支持度和置信度计算所有可能的项集之间的关联规则。 4. 对于每个项集，计算其支持度。 5. 对于每个项集的子集，计算其置信度。 6. 根据设定的阈值，筛选出支持度和置信度高于阈值的关联规则。 7. 将筛选出的关联规则作为强关联规则的样本数据集。例如，如果我们选择一个包含多个购物篮的数据集，其中包含的项集有牛奶、面包、黄油、啤酒等，我们可以设定支持度阈值为0.5，置信度阈值为0.7。通过计算所有可能的项集之间的关联规则，我们可以得到如下样本数据集： | 项集 | 支持度 | 关联规则 | 置信度 | | --- | --- | --- | --- | | 牛奶 | 0.6 | 牛奶 -> 面包 | 0.8 | | 面包 | 0.7 | 面包 -> 牛奶 | 0.85 | | 黄油 | 0.4 | 牛奶, 面包 -> 黄油 | 0.6 | | 啤酒 | 0.5 | 牛奶, 面包 -> 啤酒 | 0.7 | | 牛奶, 面包 | 0.5 | 牛奶 -> 面包 | 0.9 | | 牛奶, 黄油 | 0.3 | 牛奶 -> 黄油 | 0.5 | | 牛奶, 啤酒 | 0.4 | 牛奶 -> 啤酒 | 0.6 | | 面包, 黄油 | 0.3 | 面包 -> 黄油 | 0.43 | | 面包, 啤酒 | 0.4 | 面包 -> 啤酒 | 0.57 | | 黄油, 啤酒 | 0.2 | 黄油 -> 啤酒 | 0.5 | 这些关联规则可以作为强关联规则的样本数据集，用于发现更广泛的关联规则。

创建强关联规则的样本数据集

相关推荐

数据挖掘真题+2016-20171

数据挖掘习题题.pdf

大数据时代下的数据挖掘试题及答案.pdf

对玻璃数据集的关联规则进行分析

yolo车辆高清样本数据集

sklearn中有哪些大样本数据集

深度学习声音样本数据集制作工具

dicom数据集 小样本

DLBCL数据集有多少样本

npc对话聊天数据集样本下载

pytorch 保存创建的数据集

TensorFlow创建数据集代码

什么叫数据集一对一关联

神经网络数据集样本怎么取

sklearn怎么创建数据集

怎么计算出测试数据集样本总数

python编写apriori算法关联鸢尾花数据集

Pytorch创建自己的数据集的代码

python创建新的数据集

最新推荐

任务三、titanic数据集分类问题

pytorch学习教程之自定义数据集

keras-siamese用自己的数据集实现详解

python 实现对数据集的归一化的方法(0-1之间)

Pytorch使用MNIST数据集实现CGAN和生成指定的数字方式

京瓷TASKalfa系列维修手册：安全与操作指南

管理建模和仿真的文件

【进阶】入侵检测系统简介

轨道障碍物智能识别系统开发

小波变换在视频压缩中的应用

dicom数据集小样本