考虑下面的频繁 3 - 项集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5} 假定数据集中只有 5 个项,采用 合并策略,由候选产生过程得到 4 - 项集不包含() A、1,2,3,4 B、1,2,3,5 C、1,2,4,5 D、1,3,4,5
时间: 2024-03-07 20:52:16 浏览: 36
频繁项集合并
根据合并策略,4-项集的候选项集应该来自于频繁的3-项集的连接操作。具体地,对于两个频繁的3-项集 L1 和 L2,如果它们的前 k-2 个项相同(即 L1[0:k-2] == L2[0:k-2]),则将它们连接成一个候选的 k-项集 Ck,其中 Ck 的最后一项是 L1 和 L2 的最后一项的并集。
根据这个策略,我们可以得到所有的频繁3-项集的连接情况:
{1,2,3} 和 {1,2,4} 可以连接成 {1,2,3,4}
{1,2,3} 和 {1,2,5} 可以连接成 {1,2,3,5}
{1,3,4} 和 {1,3,5} 可以连接成 {1,3,4,5}
{2,3,4} 和 {2,3,5} 可以连接成 {2,3,4,5}
因此,所有的4-项集应该包含这些候选项集的并集。我们可以得到:
{1,2,3,4}
{1,2,3,5}
{1,3,4,5}
{2,3,4,5}
因此,选项 B、1,2,3,5 不在这些4-项集中。
阅读全文