考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

下表是一个购物篮,假定支持度阈值为40%,其中()是频繁闭项集。1.abc2.abcd3.bce4.acde5.de(多选)
A. abc
B. ad
C. cd
D. de
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

在数据挖掘和关联规则挖掘中,频繁闭项集是指在给定数据集中,具有最小支持度的频繁项集。闭项集的定义是一个项集没有超集具有相同的支持度。

为了找到购物篮问题中的频繁闭项集,我们需要分析每个可能项集的支持度。给定购物篮数据:

1. abc
2. abcd
3. bce
4. acde
5. de

假设支持度阈值为40%,则至少有3个篮子需要包含某个项集以满足这个阈值(总共5个篮子,40%的支持度就是2个或更多)。

我们可以具体分析每个选项:

- **A: abc**
- 出现在篮子1和篮子2中。
- 支持度为2/5 = 40%。
- 但是,ab和abc的支持度是相同的(没有超集具有相同支持度)。

- **B: ad**
- 出现在篮子2中。
- 支持度为1/5 = 20%。
- 不满足支持度阈值。

- **C: cd**
- 出现在篮子2和篮子4中。
- 支持度为2/5 = 40%。
- 超集cde在4号篮子中出现,其支持度较高,因此cd不是闭项集。

- **D: de**
- 出现在篮子4和篮子5中。
- 支持度为2/5 = 40%。
- 没有超集具有相同支持度,是闭项集。

从分析可以看出,选项A和D符合频繁闭项集的条件。于是,答案是 **A和D**。