考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

在决策树算法中,ID3使用哪个度量来进行特征的选择?
A. 信息熵
B. 信息增益比
C. 信息增益
D. Gini指数
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

ID3选用信息增益作为度量,C4.5选用增益率作为度量

在决策树算法中,ID3算法使用的信息度量是信息增益。因此,正确答案是 C: 信息增益。

专业分析如下:

ID3(Iterative Dichotomiser 3)算法是一种用于构建决策树的算法。它通过递归地选择最优特征来分割数据集,从而构建决策树。ID3算法的核心在于选择哪个特征来进行分裂,而这个选择是基于信息增益的。

信息增益是基于信息论的一个度量,用来衡量在选择一个特征进行分裂后,数据集的纯度增加了多少。具体来说,信息增益是通过计算分裂前后数据集的熵(entropy)来确定的。熵是一个度量数据集不确定性或混乱程度的指标。

计算信息增益的步骤如下:
1. 计算数据集的总熵。
2. 对于每个特征,计算使用该特征进行分裂后的子集的熵。
3. 计算每个特征的信息增益,即总熵减去使用该特征分裂后的加权熵。

选择信息增益最大的特征作为当前节点的分裂特征。这个过程递归进行,直到所有特征都被使用或达到某个停止条件。

因此,ID3算法使用的信息度量是信息增益,选项C是正确的。