考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

当左子树是区域类别=住宅区,右子树是区域类别=商业区时,请计算此树的Gini值为何?
A. 0.457
B. 0.367
C. 0.459
D. 0.347
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

要计算一棵二叉树的 Gini 不纯度,我们需要了解每个叶节点的类别分布。在这个问题中,我们有两个子树:左子树是“住宅区”,右子树是“商业区”。假设输入数据集中每个类别的样本数量为:

- **左子树(住宅区)**:
- 住宅区样本数量 = \(N_L\)
- 商业区样本数量 = 0

- **右子树(商业区)**:
- 商业区样本数量 = \(N_R\)
- 住宅区样本数量 = 0

计算每个子树的 Gini 不纯度:

1. **左子树 Gini 不纯度**:
\[
Gini_L = 1 - \left(\frac{N_L}{N_L + 0}\right)^2 - \left(\frac{0}{N_L + 0}\right)^2 = 1 - 1 = 0
\]
(因为左子树只有住宅区,没有其他类别)

2. **右子树 Gini 不纯度**:
\[
Gini_R = 1 - \left(\frac{N_R}{N_R + 0}\right)^2 - \left(\frac{0}{N_R + 0}\right)^2 = 1 - 1 = 0
\]
(因为右子树只有商业区,没有其他类别)

整棵树的 Gini 不纯度会以两个子树的样本比例进行加权平均。如果这棵树已经被分割为纯节点(即每个叶节点只包含一种类别),则这意味着整棵树的 Gini 不纯度为 0。

在你的选项中没有与 0 对应的值,这表明可能存在更多的背景信息或数据集中的不纯度来源未被充分考虑,或者输入数据的描述存在不完全之处。

然而,以问题提供的信息来看,纯节点的情况 Gini 不纯度为 0,与上述分析结果一致。因此,没有提供的选项是正确答案。请确认题目背景或计算条件。