18.请用AprioriAll算法如表A6-1所示的数据库例子中找出大序列,假定最小支持度为40%。 3-Sequence Support <4,5,7> 2 <4.5,6> <4,6,7> 3 <5,6,7> 2 < <4,6,8>
时间: 2024-03-19 14:41:39 浏览: 21
根据AprioriAll算法,我们需要先生成所有的频繁序列,再从中找出大序列。
首先,对于长度为1的序列,计算它们的支持度,得到如下频繁1-序列:
{4},支持度为5/6=83.33%
{5},支持度为4/6=66.67%
{6},支持度为5/6=83.33%
{7},支持度为4/6=66.67%
{8},支持度为2/6=33.33%
可以看出,{8}的支持度不足最小支持度40%,因此它不是频繁1-序列。
接下来,我们需要生成长度为2的候选序列,即{4,5}、{4,6}、{4,7}、{5,6}、{5,7}、{6,7}。
对于每个候选序列,统计其在数据库中的支持度,得到如下频繁2-序列:
{4,5},支持度为2/6=33.33%
{4,6},支持度为3/6=50%
{4,7},支持度为2/6=33.33%
{5,6},支持度为2/6=33.33%
{5,7},支持度为2/6=33.33%
{6,7},支持度为3/6=50%
可以看出,{4,5}、{4,7}、{5,6}、{5,7}的支持度不足最小支持度40%,因此它们不是频繁2-序列。
接下来,我们需要生成长度为3的候选序列,即{4,6,7}。
统计其在数据库中的支持度,得到频繁3-序列{4,6,7},支持度为3/6=50%。
因此,{4,6,7}是大序列,它是长度为3且支持度不低于最小支持度40%的频繁序列。
因此,答案为{4,6,7}。