考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

下面关于ID3算法中描述错误的是( )。
A. ID3 算法要求特征必须离散化
B. 信息增益可以用熵,而不是 GINI 系数来计算
C. 选取信息增益最大的特征,作为树的根节点
D. ID3 算法是一个二叉树模型
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

:ID3 算法是由 Ross Quinlan发明的用于决策树的算法。可以归纳为以下几点:- 使用所有没有使用的属性并计算与之相关的样本熵值- 选取其中熵值最小的属性- 生成包含该属性的节点ID3 算法对数据的要求:- 所有属性必须为离散量- 所有的训练例的所有属性必须有一个明确的值- 相同的因素必须得到相同的结论且训练例必须唯一

关于ID3算法,错误的描述是:

D: ID3 算法是一个二叉树模型。

### 专业分析:

ID3算法本质上是用于决策树的构建。它的核心概念和特点如下:

- **A: ID3算法要求特征必须离散化**
- **正确**。ID3算法通常要求输入特征是离散的。对于连续值特征,需要进行离散化处理,以便能够计算信息增益。

- **B: 信息增益可以用熵,而不是GINI系数来计算**
- **正确**。ID3算法使用信息增益来选择特征,而信息增益是基于熵的计算。与CART算法使用GINI指数不同,ID3仅依赖于熵的概念。

- **C: 选取信息增益最大的特征,作为树的根节点**
- **正确**。ID3算法在每一步选择信息增益最大的特征作为当前节点的划分标准。树的根节点是第一次选择的信息增益最大的特征。

- **D: ID3 算法是一个二叉树模型**
- **错误**。ID3算法生成的决策树不是二叉树模型,而是多叉树模型。一个特征可能有多个取值,每个取值对应一条分支,因此可以形成多叉树结构。

因此,D选项是描述错误的正确答案。