考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{1,4,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含
A. 1,2,3,4
B. 1,2,3,5
C. 1,2,4,5
D. 1,3,4,5
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

根据频繁项集的定义,频繁项集是指在数据集中出现频率超过某个阈值的项集。我们可以通过频繁3-项集来推测可能的频繁4-项集。频繁4-项集的候选必须是由频繁3-项集组合而成的,并且其所有的3-项子集也必须是频繁的。

给定频繁3-项集如下:
{1, 2, 3}, {1, 2, 4}, {1, 2, 5}, {1, 3, 4}, {1, 3, 5}, {1, 4, 5}, {2, 3, 4}, {2, 3, 5}, {3, 4, 5}

我们需要检查每个4-项集的所有3-项子集是否都在上述频繁3-项集中。

A. {1, 2, 3, 4}
- 3-项子集:{1, 2, 3}, {1, 2, 4}, {1, 3, 4}, {2, 3, 4}
- 检查:{1, 2, 3}, {1, 2, 4}, {1, 3, 4}, {2, 3, 4} 都在频繁3-项集内。

B. {1, 2, 3, 5}
- 3-项子集:{1, 2, 3}, {1, 2, 5}, {1, 3, 5}, {2, 3, 5}
- 检查:{1, 2, 3}, {1, 2, 5}, {1, 3, 5}, {2, 3, 5} 都在频繁3-项集内。

C. {1, 2, 4, 5}
- 3-项子集:{1, 2, 4}, {1, 2, 5}, {1, 4, 5}, {2, 4, 5}
- 检查:{1, 2, 4}, {1, 2, 5}, {1, 4, 5} 在频繁3-项集内,但 {2, 4, 5} 不在频繁3-项集内。

D. {1, 3, 4, 5}
- 3-项子集:{1, 3, 4}, {1, 3, 5}, {1, 4, 5}, {3, 4, 5}
- 检查:{1, 3, 4}, {1, 3, 5}, {1, 4, 5}, {3, 4, 5} 都在频繁3-项集内。

由此可以得出,频繁4-项集的候选应该是包含所有3-项子集都在频繁3-项集中的项集。因此,正确答案是:

A: {1, 2, 3, 4}
B: {1, 2, 3, 5}
D: {1, 3, 4, 5}

C: {1, 2, 4, 5} 不包含,因为其3-项子集 {2, 4, 5} 不在频繁3-项集内。