考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

下列哪些公式是决策树用来挑选字段时使用的?(多选)
A. Information Gain
B. Gain Ratio
C. Silhouette Coefficient
D. Chi-Square Statistic
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

在决策树模型中,用于选择最佳分割字段(属性)的常用算法主要包括 Information Gain 和 Gain Ratio。以下是对所有选项的分析:

1. **A: Information Gain**
- **正确**。信息增益是一种常用的决策树分裂标准。它通过计算某个属性对数据集的不确定性的减少量来选择最佳属性。决策树算法如 ID3 就是基于信息增益进行字段选择的。

2. **B: Gain Ratio**
- **正确**。增益率是信息增益的一种改进,通过对信息增益进行标准化来避免信息增益倾向于选择取值较多的字段的偏差。C4.5 决策树算法就是使用增益率来选择字段的。

3. **C: Silhouette Coefficient**
- **错误**。轮廓系数主要用于评估聚类效果,衡量数据在聚类分析中的分布质量,与决策树字段选择无关。

4. **D: Chi-Square Statistic**
- **错误**(部分正确)。卡方检验常用于统计分析中,用于判断两个分类变量之间的独立性。在某些决策树变体(如 CART 中的分类树)中可以用于属性选择,但并不是最广泛使用的标准。

综上所述,选择 A 和 B 作为决策树用来挑选字段的公式。