ID3选用信息增益作为度量,C4.5选用增益率作为度量
在决策树算法中,ID3算法使用的信息度量是信息增益。因此,正确答案是 C: 信息增益。
专业分析如下:
ID3(Iterative Dichotomiser 3)算法是一种用于构建决策树的算法。它通过递归地选择最优特征来分割数据集,从而构建决策树。ID3算法的核心在于选择哪个特征来进行分裂,而这个选择是基于信息增益的。
信息增益是基于信息论的一个度量,用来衡量在选择一个特征进行分裂后,数据集的纯度增加了多少。具体来说,信息增益是通过计算分裂前后数据集的熵(entropy)来确定的。熵是一个度量数据集不确定性或混乱程度的指标。
计算信息增益的步骤如下:
1. 计算数据集的总熵。
2. 对于每个特征,计算使用该特征进行分裂后的子集的熵。
3. 计算每个特征的信息增益,即总熵减去使用该特征分裂后的加权熵。
选择信息增益最大的特征作为当前节点的分裂特征。这个过程递归进行,直到所有特征都被使用或达到某个停止条件。
因此,ID3算法使用的信息度量是信息增益,选项C是正确的。