无解析
根据Apriori算法的原理,候选k项集的频繁项集必须满足其所有(k-1)子集都是频繁的。也就是说,如果一个k项集的任意一个(k-1)子集不是频繁的,那么这个k项集就不可能是频繁的。
我们先看看购物篮中的项集和它们的支持度:
购物篮中的项集如下:
1. {啤酒, 尿布}
2. {啤酒, 面包}
3. {面包, 尿布}
4. {啤酒, 牛奶}
假设我们已经计算了这些2-项集的支持度,并且要找出支持度不小于3的候选3-项集。
为了找到支持度不小于3的候选3-项集,我们需要先确定哪些2-项集是频繁的。假设支持度不小于3的2-项集如下:
- {啤酒, 尿布}
- {啤酒, 面包}
- {面包, 尿布}
根据Apriori算法,只有当所有的2-项集子集都是频繁的,3-项集才有可能是频繁的。
我们来看看各选项中哪些2-项集需要剪枝:
A: {啤酒, 尿布} —— 假设是频繁的,不需要剪枝。
B: {啤酒, 面包} —— 假设是频繁的,不需要剪枝。
C: {面包, 尿布} —— 假设是频繁的,不需要剪枝。
D: {啤酒, 牛奶} —— 假设不是频繁的,需要剪枝。
所以,正确答案是:
D: 啤酒、牛奶
因为在候选2-项集中,{啤酒, 牛奶}的支持度小于3,因此需要剪枝。