考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

假设要分析的数据中包含 age 这个字段。Age 字段的值若由小到大排序,其结果如下:15,16,16,19,20,20,21,22,22,25,25,25,26,30,33,33,35,35,35,36,36,40,45,46,47。请利用等深装箱法(Equal-Frequency-Interval)将数据离散化(Discretization)成5个区段。请问35会落在第几段?
A. 第2段
B. 第3段
C. 第4段
D. 第5段
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

要将数据利用等深装箱法(Equal-Frequency-Interval)离散化成5个区段,我们需要确保每个区段包含相同数量的数据点。给定的数据有25个值,因此每个区段应包含 \( \frac{25}{5} = 5 \) 个数据点。

首先,我们将数据从小到大排序:
15, 16, 16, 19, 20, 20, 21, 22, 22, 25, 25, 25, 26, 30, 33, 33, 35, 35, 35, 36, 36, 40, 45, 46, 47

接下来,我们将数据分成5个区段,每个区段包含5个数据点:

1. 第一段:15, 16, 16, 19, 20
2. 第二段:20, 21, 22, 22, 25
3. 第三段:25, 25, 26, 30, 33
4. 第四段:33, 35, 35, 35, 36
5. 第五段:36, 40, 45, 46, 47

可以看到,数值35出现在第四段。因此,正确答案是:

C: 第4段