考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

请问Apriori算法是用何者做项目集(Itemset)的筛选?
A.  信赖度(Confidence)
B. 区分度
C. 支持度(Support)
D. 相似度(Similarity)
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

Apriori算法是用**支持度(Support)**来进行项目集(Itemset)的筛选。因此,正确答案是C: 支持度(Support)。

### 专业分析

Apriori算法是一种常用的用于挖掘关联规则的算法,其主要步骤如下:

1. **频繁项集的生成**:
- 在此步骤中,Apriori算法首先找到在给定支持度阈值以上的所有频繁项集。
- 支持度(Support)定义为某个项集在数据库中出现的频率,即:
\[
\text{Support}(X) = \frac{\text{出现X的事务数量}}{\text{总事务数量}}
\]
- 项集如果满足最小支持度阈值,则被认为是频繁项集。

2. **关联规则的生成**:
- 通过频繁项集进一步生成具有高置信度的关联规则。
- 信赖度(Confidence)在生成规则时使用,衡量规则的强度,但不用于初始项集的筛选。

### 总结

- **支持度(Support)**用于筛选项目集,是Apriori算法的起始步骤。
- 然后在生成的频繁项集基础上,使用**信赖度(Confidence)**等指标生成关联规则。

Apriori算法的核心在于利用支持度来降低搜索空间,筛选出有意义的频繁项集,这就是为什么选择支持度作为项目集筛选的标准。