考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

下列何者不是决策树字段选择的度量?
A. 信息增益(Information Gain)
B. 卡方统计量(X2 Statistics)
C. 支持度(Support)
D. 基尼系数(Gini Index)
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

在决策树的字段选择中,常用的度量方法包括信息增益(Information Gain)和基尼系数(Gini Index),而卡方统计量(X2 Statistics)也是一种用于特征选择的统计方法,但通常不用于决策树的分裂判断中。支持度(Support)主要用于关联规则挖掘中,而不是用于决策树字段选择。

因此,正确答案是:**C: 支持度(Support)**。

### 专业分析

以下是每个选项的简要分析:

- **信息增益 (Information Gain)**:
- 用于测量一个特征在多少程度上可以减少数据的不确定性或熵。通常用于决定哪个特征对目标变量最有预测能力。
- 是ID3决策树算法中最常用的字段选择标准。

- **卡方统计量 (X2 Statistics)**:
- 一种统计测试,用于检验两个分类变量的独立性。虽然可以用于特征选择,但在决策树中并不常用作分裂标准。

- **支持度 (Support)**:
- 主要用于关联规则学习(如Apriori算法)中,表示一个项目集在所有事务中出现的频率。在决策树中不适用。

- **基尼系数 (Gini Index)**:
- 用于评估数据分裂时的纯度,是CART决策树算法中常用的字段选择标准。
- 基尼系数越小,节点的纯度越高。

在决策树的构建过程中,选择合适的字段选择度量是确保模型性能的重要环节。信息增益和基尼系数是最常用的两种标准,而支持度则是与决策树无关的概念。