考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

下列对C4.5算法的描述,何者为真?(多选)
A. 每个节点的分支度只能为2
B. 使用gain ratio作为节点分割的依据
C. 可以处理数值型态的字段
D. 可以处理空值的字段
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

C4.5算法是机器学习中用于构建决策树的算法,作为ID3算法的改进版,其特点如下:

1. **每个节点的分支度只能为2 (A)**:
- **错误**。C4.5算法允许节点根据属性的不同值进行多分支,而不仅限于二叉分裂。

2. **使用gain ratio作为节点分割的依据 (B)**:
- **正确**。C4.5用信息增益率(Gain Ratio)作为分裂节点的依据,避免了信息增益(Information Gain)在处理具有多种取值的属性时的偏好性。

3. **可以处理数值型态的字段 (C)**:
- **正确**。C4.5能够处理连续的数值型数据,通过确定分裂点,将数值型属性离散化,从而应用于决策树的节点划分。

4. **可以处理空值的字段 (D)**:
- **正确**。C4.5能够处理数据集中存在的缺失值。它对缺失值进行了特殊处理,使得这些数据可以被包含在模型训练和构造中。

因此,正确答案是 **B、C 和 D**。这些特性使得C4.5算法在处理复杂数据集时,表现得更加灵活和准确。