考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

假设要分析的数据中包含 Age 这个字段。Age 字段的值若由小到大排序,其结果如下:13,15,16,18,20,22,24,28,32,33,37,40,44,48,50,52,55,58。请利用等宽装箱法(Equal-Width-Interval)将数据离散化(Discretization)成3个区段。离散化后的结果应为?
A. 区段一、13,15,16,18,20,22,24,28区段二、32,33,37,40,44区段三、48,50,52,55,58
B. 区段一、13,15,16,18,20,22区段二、24,28, 32,33,37,40区段三、44, 48,50,52,55,58
C. 区段一、13,15,16,18,20区段二、22,24,28, 32,33,37区段三、40,44,48,50,52,55,58
D. 区段一、13,15,16,18,20,22,24区段二、28,32,33,37,40区段三、44,48,50,52,55,58
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

为了使用等宽装箱法(Equal-Width-Interval)将数据离散化成3个区段,首先需要计算区段的宽度。给定的数据从13到58,因此我们可以首先确定区间范围,然后确定每个区段的宽度。

### 数据分析:

1. **数据范围**:
- 最小值(Min):13
- 最大值(Max):58

2. **总范围**:
\( \text{范围} = 58 - 13 = 45 \)

3. **区段数**:3

4. **区段宽度**:
\( \text{区段宽度} = \frac{\text{总范围}}{\text{区段数}} = \frac{45}{3} = 15 \)

### 区段划分:

根据等宽装箱法:

- **区段一**:\[13, 13+15) = [13, 28)
- **区段二**:\[28, 28+15) = [28, 43)
- **区段三**:\[43, 43+15] = [43, 58]

### 离散化数据:

将数据放入相应的区段:

- **区段一**(13到小于28):13, 15, 16, 18, 20, 22, 24
- **区段二**(28到小于43):28, 32, 33, 37, 40
- **区段三**(43到58):44, 48, 50, 52, 55, 58

### 选择答案:

分析得出的区段与选项对比:

D:
- 区段一、13, 15, 16, 18, 20, 22, 24
- 区段二、28, 32, 33, 37, 40
- 区段三、44, 48, 50, 52, 55, 58

因此,**正确答案是 D**。