基于矩阵的Apriori算法改进研究
需积分: 47 107 浏览量
更新于2024-09-09
收藏 253KB PDF 举报
数据挖掘关联规则Apriori算法的一种新改进
Apriori算法是数据挖掘关联规则算法的核心,但随着对关联规则研究的深入,它的缺点也暴露出来了。Apriori算法有两个致命的性能瓶颈:多次扫描事务数据库,需要很大的I/O负载;产生庞大的候选集。因此,Apriori算法仍有需要改进的地方。本文提出了一种新的基于矩阵的改进Apriori算法,充分利用了内存空间,大大减少扫描数据库的次数,多次试验的结果表明该方法有效提高了大型数据库的使用效率。
知识点:
1. 数据挖掘(Data Mining):从大量数据中提取或“挖掘”知识,它能高度自动化地分析原有的数据,做出归纳性的推理,从中挖掘出潜在的模式,预测出对象的行为。
2. 关联规则挖掘:从数据库中得出数据相关性的代名词。关联规则挖掘主要集中在三个方面:基于项的关联规则挖掘、定量的关联规则挖掘、因果规则。
3. Apriori算法:数据挖掘关联规则算法的核心,但Apriori算法有两个致命的性能瓶颈:多次扫描事务数据库,需要很大的I/O负载;产生庞大的候选集。
4. 改进Apriori算法:提出了一种新的基于矩阵的改进Apriori算法,充分利用了内存空间,大大减少扫描数据库的次数,多次试验的结果表明该方法有效提高了大型数据库的使用效率。
5. 数据挖掘定义:从广义的观点,数据挖掘是从大型数据集(可能是不完全的、有噪声的、不确定性的、各种存储形式的)中,挖掘隐含在其中的、人们事先不知道的、对决策有用的知识的过程。从狭义的观点,数据挖掘是从特定形式的数据集中提炼知识的过程。
6. 关联规则:关联规则是形如:A→B的蕴涵式,其中A⊆I,I⊆B,且A∩B=∅。关联规则可以被用来挖掘关联模式,进行异常检测。
7. 项集:设I={i1,i2,…,im}是项的集合,D={t1,t2,…,tm}(其中ti={i1,i2,…,ik}∈I)是数据库事务的集合,每一个事务有惟一标识符,称作TID。
8. 聚类算法:可以被用来构建正常行为模式,进行异常检测。
9. 分类算法:可以用来构造分类器,分类器经过大量的入侵数据集训练之后可以用于入侵检测。
10. 序列模式挖掘算法:可以被用来发现数据的前后关系,挖掘出序列模式。
268 浏览量
151 浏览量
点击了解资源详情
201 浏览量
133 浏览量
908 浏览量
2019-09-10 上传
115 浏览量
2021-07-14 上传
weixin_39840914
- 粉丝: 436
- 资源: 1万+
最新资源
- starting-struts2-chinese(深入浅出Struts 2).pdf(中文的!全面介绍了)
- 搞懂XML,看清SOAP.pdf
- 计算机网络——自顶向下方法与Internet特色(英文答案)
- 一本完整的C#完全手册
- DSP学习资料\DSP入门教程.pdf
- MINIGUI编程指南.pdf
- 最权威的java 技术面试
- webwork学习资料
- JAVA实用教程电子教程
- eclipse插件开发指南
- 高质量C++编程指南
- MQ FOR AIX 安装配置维护手册
- AIX平台下Message+Broker安装指南
- 拯救蓝色巨人电子书(IBM)
- 网络就绪:电子商务时代的成功战略电子书
- ARM经典300问 经典资料 不得不看