考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

请根据Apriori算法回答以下问题: (1)利用Apriori算法计算频繁项集可以有效降低计算频繁集的时间复杂度。上述购物篮中产生支持度不小于3的候选3-项集,在候选2-项集中需要剪枝的是()
A. 啤酒、尿布
B. 啤酒、面包
C. 面包、尿布
D. 啤酒、牛奶
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

要解决这个问题,我们需要了解Apriori算法的基本步骤和剪枝规则。

Apriori算法通过以下步骤来发现频繁项集:
1. 找出所有单个频繁项集(支持度不小于最小支持度的项集)。
2. 利用这些频繁项集生成候选2-项集。
3. 计算候选2-项集的支持度,筛选出支持度不小于最小支持度的频繁2-项集。
4. 利用频繁2-项集生成候选3-项集。
5. 计算候选3-项集的支持度,筛选出支持度不小于最小支持度的频繁3-项集。

剪枝规则:一个k-项集是频繁的,当且仅当它的所有(k-1)子集都是频繁的。因此,如果一个候选k-项集的某个(k-1)子集不是频繁的,那么这个k-项集也不是频繁的,可以被剪枝。

根据题目,支持度不小于3的候选3-项集有:
- 啤酒、尿布、面包
- 啤酒、尿布、牛奶
- 啤酒、面包、牛奶

接下来我们考虑在候选2-项集中需要剪枝的项集。假设支持度不小于3的候选2-项集有:
- 啤酒、尿布
- 啤酒、面包
- 面包、尿布
- 啤酒、牛奶

我们需要检查这些2-项集是否都出现在支持度不小于3的候选3-项集中。

1. 啤酒、尿布:出现在所有候选3-项集中。
2. 啤酒、面包:出现在啤酒、尿布、面包和啤酒、面包、牛奶中。
3. 面包、尿布:出现在啤酒、尿布、面包中。
4. 啤酒、牛奶:出现在啤酒、尿布、牛奶和啤酒、面包、牛奶中。

因此,所有候选2-项集都出现在支持度不小于3的候选3-项集中,没有需要剪枝的项集。

综上所述,正确答案是:没有需要剪枝的候选2-项集。