考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

请根据Apriori算法回答以下问题: (1)利用Apriori算法计算频繁项集可以有效降低计算频繁集的时间复杂度。上述购物篮中产生支持度不小于3的候选3-项集,在候选2-项集中需要剪枝的是()
A. 啤酒、尿布
B. 啤酒、面包
C. 面包、尿布
D. 啤酒、牛奶
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

无解析

根据Apriori算法的原理,候选k项集的频繁项集必须满足其所有(k-1)子集都是频繁的。也就是说,如果一个k项集的任意一个(k-1)子集不是频繁的,那么这个k项集就不可能是频繁的。

我们先看看购物篮中的项集和它们的支持度:

购物篮中的项集如下:
1. {啤酒, 尿布}
2. {啤酒, 面包}
3. {面包, 尿布}
4. {啤酒, 牛奶}

假设我们已经计算了这些2-项集的支持度,并且要找出支持度不小于3的候选3-项集。

为了找到支持度不小于3的候选3-项集,我们需要先确定哪些2-项集是频繁的。假设支持度不小于3的2-项集如下:
- {啤酒, 尿布}
- {啤酒, 面包}
- {面包, 尿布}

根据Apriori算法,只有当所有的2-项集子集都是频繁的,3-项集才有可能是频繁的。

我们来看看各选项中哪些2-项集需要剪枝:
A: {啤酒, 尿布} —— 假设是频繁的,不需要剪枝。
B: {啤酒, 面包} —— 假设是频繁的,不需要剪枝。
C: {面包, 尿布} —— 假设是频繁的,不需要剪枝。
D: {啤酒, 牛奶} —— 假设不是频繁的,需要剪枝。

所以,正确答案是:
D: 啤酒、牛奶

因为在候选2-项集中,{啤酒, 牛奶}的支持度小于3,因此需要剪枝。