没有合适的资源?快使用搜索试试~ 我知道了~
沙特国王大学学报面向大数据的内存优化分布式效用苏尼尔·库马尔a,克里希纳·库马尔·莫赫贝aa印度阿杰梅尔拉贾斯坦邦中央大学计算机科学系阿提奇莱因福奥文章历史记录:2021年2月3日收到2021年4月3日修订2021年4月27日接受2021年5月23日网上发售保留字:高实用性模式识别分布式计算并行计算Spark大数据A B S T R A C T近年来,社交媒体、在线服务、智能手机和物联网(IoT)每秒都会产生生成的数据是结构化的、非结构化的或半结构化的,并以各种格式提供。因此,传统的方法不足以有效地处理这种数据。高效用模式挖掘是数据分析的一个著名的研究领域,它结合了效用度量来考虑基于用户的约束,例如单元数量和收益,以及数据集的频率统计。作出有效的决定也是至关重要的,在过去十年中,对这方面的需求正在增加。基于效用的频繁模式提取技术已经被提出。然而,这些方法受限于数据大小并且在独立系统上操作。我们提出了一个并行的方法命名为分布式内存优化的效用挖掘(DMOUM)的高效用为基础的频繁模式挖掘,以解决这个问题。实现了一种新的剪枝技术,大大减少了处理时间和内存使用。所提出的方法可以处理大量的数据,即,大数据DMOUM方法在集群节点架构中使用Spark实现。在各种实时数据集上验证了结果,发现所提出的方法在运行时间、内存消耗和可扩展性方面比前沿方法具有更好的性能。拟议的工作将为医疗保健、教育、电子商务等实时问题提供解决方案。版权所有©2021作者。由爱思唯尔公司出版代表沙特国王大学这是一个开放的访问CC BY许可下的文章(http://creativecommons.org/licenses/by/4.0/)。1. 介绍高效用模式挖掘(HUPM)是近年来受到广泛关注的主要问题之一。这在很大程度上是因为它在不同的现实生活应用中的未来适用性。它的目的是识别一个给定的数据集中的对象的集合,至少作为用户定义的阈值的实用程序。HUPM为商务人士提供了将其要素效用(利润、利益等)概念纳入其中的能力。在采矿过程中。因此,所确定的模式对政策/决策者来说更为重要。相反,FPM(频繁模式挖掘)依赖于数据集中的项目频率。然而,高效用挖掘是频繁模式挖掘的扩展变体。现有技术结合了效用度量,而后一种方法采用元素支持或频率来发现电子邮件地址:gmail.com(S.Kumar),kmohbey@gmail.com(K.K. Mohbey)沙特国王大学负责同行审查重要的模式频繁项集提取(Agrawal等人,1993; Agrawal等人,1994;Han等人,2000; Zaki等人,1997;Gan等人,自从Agrawalet al.( 1993 ) 建 立 了 频 繁 模 式 的 概 念 以 来 , 频 繁 模 式 ( FrequentPatterns)已经成为一个流行的领域。这些模式挖掘算法研究项目集的重复出现。Apriori算法(Agrawal等人,1994年)最初引入的算法中,数据库已被搜索多次挖掘模式。FP-生长(Han等人,2000年)是第二个流行的方法来检测重复事件使用一个紧凑的FP树结构,只有两个数据库扫描。该算法利用了一个向下闭包性质(称为Apriori性质),即非频繁项集的超集总是非频繁项集,而频繁项集的子集总是频繁项集。即使FPM总是找到频繁的项目组。然而,具有高有用性和盈利性而不是发生的对象的集合可以被忽略。例如,键盘和鼠标经常被购买。然而,笔记本电脑或打印机的购买并不频繁,而且具有很高的概率,但可能没有被纳入FPM的调查结果。因此,高效用模式挖掘(HUPM)的原理(Fournier-Viger等人,2014; Liu和Qu,2012; Liu等人,2012年)开发。https://doi.org/10.1016/j.jksuci.2021.04.0171319-1578/©2021作者。由Elsevier B.V.代表沙特国王大学出版。这是CC BY许可下的开放获取文章(http://creativecommons.org/licenses/by/4.0/)。制作和主办:Elsevier可在ScienceDirect上获得目录列表沙特国王大学学报杂志首页:www.sciencedirect.comS. Kumar和Krishna Kumar Mohbey沙特国王大学学报6492HUPM是一种不断发展的数据挖掘策略,它解决了FPM的限制。它考虑消费者的目标和目的以及原始数据,而FPM只考虑整体模式频率。高效用模式挖掘旨在发现具有最小效用阈值的模式。为了提取一组有用的项目集,HUPM结合了内部和外部实用程序(Yao等人, 2006年)的报告。内部效用是与记录相关的统计HUPM是棘手的,因为措施的基础上的效用,并未能保持向下关闭属性。许多作者提出了几种基于高效用的提取方法。这些算法对于包含有限数量记录的数据集是有效的。然而,数据大小是动态变化的,并且快速增加。因此,基于独立系统的方法可能不足以管理和分析大量记录。由于近年来来自不同行业的显著信息爆炸,存储和处理已造成重大障碍。有两个因素使得将项集挖掘技术应用于巨大的事务记录成为一个挑战。首先,大量记录提供了大量与设备内存不匹配的候选项集。其次,大多数挖掘技术都是设计用于单个机器框架,无法用于大数据存储和处理。在数据挖掘中(Hossain等人,2019; Kampta等人,2004年; Pol例如,2008; Stergiou等人,2021; Talia等人,2015; Jeba等人,2021; Padhy等人, 2012)的关键挑战始终是从大型数据集中提取相关信息。分布式计算解决了这些问题。大量的研究是利用并行和分布式处理的项集挖掘进行的。然而,它需要解决一些问题,以纳入分布式算法,如何分割搜索空间,并减少内存开销和可扩展性的问题。为了管理分布式架构上的计算负担,例如如何将任务拆分和分散在多个设备上是至关重要的。在分布式数据处理中,搜索空间的划分是一项棘手的工作.大数据集上的高效用模式分析面临着候选项集导致的搜索空间的增加.然而,由于向下闭合性质不适用于效用测度,HUPM中的剪枝比规则模式分析复杂得多受上述问题的刺激,我们引入了一种称为分布式内存优化效用挖掘(DMOUM)的算法,以并行和分布式模型从海量数据集中发现HUI。DMOUM基于Apache Spark框架(Zaharia等人, 2012),并受益于Spark的一系列属性,如内存计算,容错和高可扩展性。我们引入了一种新的方法来有效地修剪搜索空间和不相关的中间候选集,这大大减少了处理时间和内存需求。实验结果表明,DMOUM大大提高了标准方法,有效地发现高效用项集(HUIs)。所提出的技术可以应用于许多现实生活中的应用,如,Web信息处理,推荐系统,电子商务管理和规划,电信数据分析,生物信息学,分类和预测建模。本文的主要贡献如下1. 实现了一种剪枝策略,以消除不感兴趣的候选项集。与最先进的算法相比,这将导致更少的执行2. 该方法产生搜索空间的较小部分因此,最小化在挖掘期间保存记录所需的存储。3. 算法的两个变种,DMOUM和DMOUM-Baseline,被实现来测试剪枝策略4. 进行了全面的测试,以评估运行时性能,内存需求,可扩展性,并在DMOUM处理中产生的候选项集的数量。实验结果表明,该方法在处理时间、内存消耗和可扩展性方面都优于现有的挖掘方法.此外,实验结果表明,一个更小的候选项集的数量进行处理相比,基线变量提取高效用的项集。本文的其余部分结构如下:第2节解释了与拟议工作相关的先前研究和文献。第3节详细介绍了所提出的方法。第4节介绍了调查结果和讨论。最后,结论见第6节。2. 相关工作数据挖掘(Barber和Hamilton,2003; Chen等人,1996;Fournier-Viger等人,2017; Gan等人,2017; Gan等人, 2018年;Gan等人,2019; Han等人,2000)是从大的记录集合中提取信息的过程。FPM已经成为著名的数据挖掘工具之一。FPM是对事务中频繁发现的一组对象的检测,即,出现率达到指定限制的项集。频繁项集分析是几种常见挖掘活动的基础,并有几种实现。Agrawal等人(1994)介绍了Apriori算法,这是第一个重大进展。Han et al.(2000)提出了FP-Growth算法,使用称为FP-tree的树结构进一步提高挖掘效率。FPM不分析产品的成本或数量。因此,引入了许多加权频繁模式挖掘算法(Vo等人,2013; Yun等人,2017; Yun和Ryu,2013)。这些方法基于权重并分配项目的重要性。对频繁项集分析的研究作为许多数据挖掘活动的基础继续发展,包括传统的顺序挖掘(Mannila等人,1997; Huang和Chang,2008)和情节挖掘(Agrawal和Srikant,1995; Han等人,2001年)。高效用模式挖掘(Raj等人,2021; Sethi和Ramesh,2020; Kim等人,2021年; Wu等人,2021; Baek等人,2021; Mohbey等人,2021)是频繁项集挖掘的扩展版本,它考虑了元素数量(内部效用)和利润值(外部效用)。已经为HUPM开发了许多应用,例如网页点击流观察(Ahmed等人,2009年; Li等人,2008; Shie等人,2010)、超市商业性能和促销(Erwin等人,2008年; Li等人,2005; Li等人,2008)、基因控制(Shie等人,2013年),以及生物医学技术。效用概念最早由Yao等人(2004,2006)引入,并引入了一个上限属性来修剪搜索空间,但由于候选集的组合爆炸问题,在整个计算过程中继续失败。Liu等人(2005年)提出了一种基于两阶段Apriori的方法来检测数据集的几次扫描中的HUI收集Erwin etal.(2007)引入了基于模式增长模型的高效用项集挖掘算法。为了提取有用的元素,HUP-Prune(Ahmed等人,2009年),并需要几个数据库检查,以发现适当的HUI。Lin等人(2011)通过整合FP树和事务加权效用(TWU)过程,建立了一种基于HUP树结构的方法。为了有效地过滤掉基于UP树的不希望的候选者,Tseng等人 。 提出的 UP-Growth ( Tseng 等 人 , 2010 ) 和 UP-Growth+(Tseng等人,2012)算法。为了组织对象上的效用值,S. Kumar和Krishna Kumar Mohbey沙特国王大学学报64931/4fgð Þll拉克里尔LL设计了实用程序列表布局被显式地用于获取所有的HUI及其实用程序。许多这样的算法(Fournier-Viger等人,2014; Liu和Qu,2012; Liu等人,2012; Liu等人,2005年; Ahmed例如,2009)使用基于TWU的修剪策略。FHM(Fournier-Viger等人,2014)是HUI-Miner的一个改进版本,它使用了新的估计效用共生修剪(EUCP)方法来最大限度地 减 少 低 效 的 效 用 列 表 连 接 操 作 。 HUP-Miner 算 法 也 基 于 HUIMiner,由Krishnamoorthy(2015)介绍。d2HUP算法由Liu等人(2012)提出,它使用线性数据库结构,严格的上限,强大的修剪和反向枚举树来列出模式。Zida et al.(2017)提出了一种比d2HUP更强大的算法,用于提取具有短项集的密集数据集。然而,它对于使用长模式的、密集的数据集和分析大的或稀疏的数据集的效率较低。各种HUIM扩展也在开发中。已经开发了许多算法来提取平均效用项集挖掘,其考虑元素的长度(Lin等人,2017; Yun等人,2018年)。流数据的HUI的发现(Yun等人,2017年)也是一个困难的问题,因为必须在一个时间窗口内掌握足够的细节来挖掘整个HUI。top-k HUPM(Wu等人,2012)近年来已经成为一个迷人的主题,以确定高端的HUI,而不是利用整个HUI。这些HUPM算法中的大多数是针对独立机器的,这不适合于大数据处理。并行和分布式计算是提高执行效率的常用方法。并行处理技术包括多核架构,这足以提高各种算法的性能然而,这些算法几乎没有用于数据分析一些依赖于分布式的并行系统pECONDUCTOR是ECONDUCTOR的一项进步,旨在实现共享的数据库平台。 PHAUIM(Sethi等人, 2019)是HAUI-Miner算法的改进,用于从多节点集群上的大型事务数据库中发现HUI。表1给出了流行的HUIM算法的描述(Kumar和Mohbey,2019)。3. 预赛设E^fe1;e2;. ;e kg;是事务数据集DB t1;t2;.中的一组元素。;tm. 表2中给出了一个包含元素及其计数的五个事务数据集的实例。一有限项集a,使得a为a。在HUI挖掘过程中,使用了以下几个定义。定义1(效用类型):事务中元素的计数是内部效用。元素的内部效用在每个事务中可能不同。元素的外部效用是业务的有用性和盈利能力,与内部效用不同,这对于数据集中的每个交易都是相同的。数据集的内部效用和外部效用分别见表2和表3定义2(效用):元素e在交易t l中的效用值表示为Ue;t llI Ue;t l×E Ue。事务t中的元素集合a的效用,即,a;t,被测量为聚集。门的所有包含元素的实用程序。Ua;tlPe2a^VtlUe;tl。例1. 在数据集DB中,a的效用,即Ua,表示为:你可以在2个DB的U盘上找到它。内存框架具有被提出了DTWU矿业(Vo等人,2009)是TWU-Mining的分布式变体(Lin等人,2011年)。消息传递模型和分布式计算被用于DTWU-Mining(Vo等人,2009年)。对于并行HUI识别,它使用WIT-Tree结构来保存本地数据库在每个节点上。为了有效地过滤搜索空间和不相关的局部无用元素集合,采用DLR-MR技术。PHUI-生长(Lin等人,2015)是一种基于先验的方法,在Hadoop框架上实现。PHUI-矿工(Chen等人,2016)是HUI-Miner(Liu和Qu,2012)的平行扩展。PHUI-Miner拆分了HUPM任务,并将其分配给一个集群,该集群可以分离作业负载并产生更好的结果。P-FHM+(Sethi等人,2018)是FHM+的一个平行变体,它考虑了长度的限制。它提取用户定义的长度为基础的高效用模式。它可以用于挖掘集群机架构上的大规模数据。pEglutamine(Nguyen等人,2019)算法采用多核处理器来提高HUI挖掘性能。例1.项集e1e2的效用可以计算为:Ue1e2Ue1e2;t2Ue1;t2Ue2;t21× 6 5× 321。定义3(交易效用):交易的交易效用tl是由TU t表示的tl中包括的每个项目的总效用,并指定如下:你应该把你的名字写下来表2交易集TID元素:计数t1e1:1,e3:1,e4:1t2e1:1,e2:5,e3:1,e4:3,e5:1,e6:1第三节第一节第二节第三节第六节第五节第二节第四节第二节第三节第四节第三节第五节第一节第五节第二节第三节第二节第四节第一节第五节第一节表1并行和分布式高效用模式挖掘方法。不需要跨所有节点合并数据库。● 它需要对记录集进行多次扫描。算法年数据布局特性DTWU-Mining(Vo等人,(2009年)2009垂直(WIT树)● 引入了一种新的数据结构,将数据集扫描次数减少到一次,● 该算法不适用于大规模数据集。PHUI-生长(Lin等人,( 2015年)2015水平(u-transaction)●提出了一种新的剪枝技术DLU-MR。PHUI-Miner(Chen等人,(2016年)2016垂直(效用列表)●基于项集压缩等近似的挖掘方法,P-FHM+(Sethi等人, 2018年)2018垂直(实用程序列表)抽样技术● 搜索空间分割策略不能提供最优效率。● P-FHM+将元素长度作为提取模式的一个实用性度量该算法采用的负载分配方式效率不高。PHAUIM(Sethi等人, 2019年度)2019垂直(AU列表)● 提出了一种基于搜索空间分割的项集过滤方法,并利用模式的平均效用提取项集。pEglutamine(Nguyen等人,2019年度)2019水平● 采用静态负载平衡的任务并行处理。S. Kumar和Krishna Kumar Mohbey沙特国王大学学报6494>>PFG表3外部公用事业元件e1e2e3e4e5e6e7值6323466定义4(事务加权效用): TWU是包含项集a的所有事务的效用的聚合。TWUaPatlTU tl实施例2. 在指定的事务集中,事务t1,t2,t3,t4和t5元素e1的TWU:TWUe1TUt1TUt2图3-11- 42- 38- 91。定义5.元素在事务中按TWU递增顺序的排序是整体排序,用符号表示。数 据 库 中 每 个 元 素 的 TWU 如 表 4 所 示 。项 目 的 总 排 序 如 下 :e6>e2>e1>e4>e5>e3。定义6. (剩余效用):让E中的项目顺序 (例如,字典的顺序)。在交易t1中,一组物品a的剩余效用被表示为re_a;t_l_l_i>x8x2a_U_i; t_l_i。定义7(元素扩展):对于E中的元素,设order>.所有扩展a的元素可以被集成为称为元素a的扩展的一组元素,公式化如下:例如,A/C.2/C.3/C.4/C.5/ C.6/C.7/C.8/C.定义8(单项扩展):元素集x是a的单项扩展。如果它是搜索空间的集合枚举树表示中的直接子元素.定义9(HTWUI):高事务加权实用程序项集a在数据库DB中,当其TWU值超过阈值限制时。HTWUI←fajTWUaPminThresg4. 该方法本 节 将 讨 论 所 提 出 的 算 法 , 分 布 式 内 存 优 化 效 用 挖 掘(DMOUM)。它是一种分布式并行算法。我们实现了一种新的剪枝技术,在数据划分和节点数据生成过程中迭代地删除不希望的事务它有助于减少所有搜索空间和候选项集,从而在执行时间和内存使用方面实现更有效的处理该算法包含以下步骤:(1)1-HTWUI生成;(2)数据库拆分和分配到工作节点;(3)剪枝策略;(4)算法。4.1. 1-HTWUIs的构建为了创建每个单个元素(1-HTWUI)的高事务加权效用元素,使用基于数组的结构。TWU上限用于过滤1-HTWUIs。TWU值大于最小效用阈值的元素包含在1-HTWUI列表中。TWU度量被用来作为一个上界来消除数据库中的不需要的元素.如果任何元素的效用小于TWU,则该元素不能在1-HTWUI中(Liu等人, 2005年)。因此,所有没有希望的项目都从数据集中丢弃。在删除不合适的对象后,如果数据库中有空白记录,则将删除这些实体,并根据每个事务中的TWU进行排序。TWU规则的修剪有助于避免不相关的遍历。例如,事务数据库中有六个项D与TWU1.91;TWU 2.90;TWU 3.139;TWUe4¼101;TWUe5¼ 128;TWUe6¼ 42和TWUe7¼38:阈值被认为是40。项e7则将不被看好,因为TWU小于最小阈值。具有比阈值限制更大的效用的项目按如下顺序组织:e6;e2;e1;e4;e5;和e3。4.2. 数据分区数据拆分和本地处理是加速大数据计算、增强可扩展性和有效内存利用率的两个关键策略。数据集表示可以是水平的或垂直的。近年来,大多数算法采用水平表示,这更适合于有效的处理。垂直表示的优点是不必在每次迭代中搜索整个数据集,并且尺寸小于水平数据集。然而,在许多场景中,例如事务合并、数据库投影和用于高效挖掘UI的快速效用计算,水平数据库表示具有优势。三个主要的水平划分方案建立:范围,随机和散列分裂。所有这些技术进行了检查,我们采用了基于哈希的映射策略。通过对项集进行散列并根据散列值将它们映射到分区,将数据分成子集。我们使用了映射方法,它类似于循环映射方法。我们在N个工作节点之间分配排序的项目,如1,二,三,... . ,N,则N,N-1,. . ,1分别。划分方法如图1所示。这种划分方法的动机来自pfp(Li等人,2008年)。对于每个节点,创建数据集的投影部分,其可以足以在本地提取特定节点处的HUI项集。只有这些事务才包括在投影节点数据中,由分配给特定节点的元素组成。此外,我们在节点数据中包括投影事务,这只是事务的一部分,以最小化数据集的大小。 图2显示了为三个节点中的每一个生成的投影节点数据。定义10.由a元素集的a-DB符号化的数据集DB的投影数据库如下:a-DB2fa-tljtl2DB2fa-tl哪里 a-tl¼ feje2tl^e2Exag是元素集a的事务tl的投影。表4元素的事务加权效用(TWU)元件e1e2e3e4e5e6e7值91901391011284238S. Kumar和Krishna Kumar Mohbey沙特国王大学学报6495ð Þ2ð ÞðÞ2ð Þ ð Þ ðÞfgFig. 1. 搜索空间划分策略。4.3. 修剪技术本节介绍修剪策略。该算法的剪枝过程分为三个阶段。第一种修剪技术在使用TWU度量计算1- HTWUI之前集成。第二种剪枝方法是基于数据划分后工作节点挖掘过程中的子树效用和局部效用上限。第三,提出了一种改进的剪枝技术来过滤数据集划分和节点数据生成过程中的事务。TWU具有向下闭合属性,该属性指示a的任何超集的效用值小于所有超集的最小阈值限制itemsetaif TWUaminThres。然后将a包括在输出中。换句话说,a被包括在高效用项集中.此外,为a创建一个投影数据集,并计算关于a的主项和次项。采矿程序会反复调用-礼貌的方式。算法1:DMOUM(分布式内存优化效用挖掘)输入:D:数据集,minThres:最小效用阈值输出:高效用项集1:通过扫描数据库2计算每个项目的TWU:Secondary(c)= {ej e2 E^TWUc;e^P minThres}3:生成项集c的二级列表4:对于所有的transactiont2Dataset do5:从每个表中删除项目R6: 如果t.count==NULL,则7:删除t8:如果结束9:按结束顺序对数据集中的TWU值排序10:结束11:通过扫描修订的数据库12:使用子树生成项集c的主项实用13:过滤每个节点的主项和次项14:生成节点数据15:对于所有i2个节点,16:对于所有事务t2node-data(i)do17:如果tR次要(i)的第一项,则18:从修订的数据库中删除t 19:如果20:结束21:结束22:对于所有i2个节点,23:本地矿工(/,node-data(i),primary(i),secondary(i),minThres)24:结束表5投影数据集。节点1节点2节点3fe62gfe16;e215;e36;e49;e54;e62gfe612gfe66gfe6 4gfe215;e36;e49;e54;e62gfe58;e612gfe212;e49;e54;e66gfe26;e43;e54;e64ge36;e43;e62gf36;e49;e54;e62gf312;e58;e612gf49;e54;e66 gS. Kumar和Krishna Kumar Mohbey沙特国王大学学报6497联系我们联系我们FG格奥尔基夫ð Þ ð Þ ð ÞÞ在生成节点数据之后,每个节点为分配的事务挖掘本地HUI。算法2演示了挖掘过程。算法2:本地矿工(在本地节点上挖掘)输入:c:前缀项集,c-DB:c投影数据集,主数据集(c),次数据集(a),minThres输出:节点上的HUI1:对于所有iteme2主do2:a←c[feg3: 计算U_minThres并创建一个-DB4:如果U_minThres,则5:输出a6:如果结束7:对于所有事务t2a-DB do8:如果tR次(i)的第一项,则9:删除事务t10:如果结束11:结束12:计算所有项目的子树和局部效用2通过扫描列表a进行辅助-DB13:为项目集a生成主列表和次列表14:本地矿工(a,projected-dataset,primary(a),secondary(a),minthres)15:结束4.5. 所示例的实例本小节提供了一个全面的说明,以帮助理解所提出的DMOUM算法是如何工作的。该示例说明了如何使用表2和表3中所示的数据库逐步实现所提出的算法。最低的效用阈值最初设置为42,我们假设我们设置了具有三个工作节点的集群。该程序解释如下。步骤1:建议的DMOUM最初执行预处理阶段以加载输入数据库.然后可以获得交易加权效用(第1行,算法1),如表1所示四、接下来,滤波器有前途项目和排序元件e6e2e1e4e5e3按TWU的递增顺序,以及数据-在图2中可以得到仅具有有希望的元素的基(Algo 1,第4-10行步骤2:进一步扫描数据集以测量每个元素子树效用。结果是:su/;e111 1 38 , su/;e21 142 , su/;e31 184 , su/;e41 164 ,su/;e5150,su/;e6144,和su/;e726。因此,主元素=e1,e2,e3,e4(Algo 1的第11-仅检查e1、e2、e3和e4的子树。但是每个子树中的项e1、e2、e3、e4、e5、e6可以在后代节点中考虑,因为它们属于次要元素。步骤3:分别为节点1、节点2和节点3生成主列表和辅列表(第13行,算法1)。小学语文1册:fe1;e6g;中学语文 1册:fe1g小学语文2册:fe;eg;中学语文 2册:feg节点1:fe1;e6g节点2:fe2;e5g节点3:fe3;e4g第5步:修剪技术(第15如果事务的第一项不属于主集,则应删除整个事务。所得节点数据集在node1:fe16;e215;e36,e49;e5 4;e6 2:步骤6:然后调用每个工作节点的本地挖掘过程(Algo 2)来执行挖掘过程。它接收节点数据,节点(i)的主项和次项作为参数(第23行,算法1)。步骤7:递归挖掘应使用本地挖掘过程进行该技术从元素e1开始处理搜索空间,并生成投影的fe1g-DB数据集.然后,计算了U fe1g,发现Ufe1g36。自fe1g不是高实用程序项集。如果1gkminThres,则项集
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- BottleJS快速入门:演示JavaScript依赖注入优势
- vConsole插件使用教程:输出与复制日志文件
- Node.js v12.7.0版本发布 - 适合高性能Web服务器与网络应用
- Android中实现图片的双指和双击缩放功能
- Anum Pinki英语至乌尔都语开源词典:23000词汇会话
- 三菱电机SLIMDIP智能功率模块在变频洗衣机的应用分析
- 用JavaScript实现的剪刀石头布游戏指南
- Node.js v12.22.1版发布 - 跨平台JavaScript环境新选择
- Infix修复发布:探索新的中缀处理方式
- 罕见疾病酶替代疗法药物非临床研究指导原则报告
- Node.js v10.20.0 版本发布,性能卓越的服务器端JavaScript
- hap-java-client:Java实现的HAP客户端库解析
- Shreyas Satish的GitHub博客自动化静态站点技术解析
- vtomole个人博客网站建设与维护经验分享
- MEAN.JS全栈解决方案:打造MongoDB、Express、AngularJS和Node.js应用
- 东南大学网络空间安全学院复试代码解析
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功