考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

下列等宽(Equal-Width-Interval)装箱法的描述,何者正确?
A. 运行速度较等分(Equal-Frequency-Interval)装箱法慢
B. 每个箱子的范围(Range)不固定
C. 无法针对分区后各个数据集的特征做数据清洗
D. 有些箱子可能沒有数据
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

正确答案是:D: 有些箱子可能没有数据。

### 专业分析:

等宽装箱法是数据分箱的一种方法,它的基本思想是将数据的范围划分为若干个等宽的区间(箱子)。下面是各选项的分析:

- **A: 运行速度较等分(Equal-Frequency-Interval)装箱法慢**
- 错误。等宽装箱的运行速度通常较快,因为它只需要根据数据的最大和最小值来确定每个箱子的范围,而不需要排序和统计每个区间内的数据频率。

- **B: 每个箱子的范围(Range)不固定**
- 错误。在等宽装箱法中,每个箱子的范围是固定的,因为箱子的宽度是通过将数据的总体范围除以箱子数量来确定的。

- **C: 无法针对分区后各个数据集的特征做数据清洗**
- 错误。等宽装箱法本身并不涉及数据清洗的问题,它只是将数据分为区间。因此,可以在分箱后对各个箱中的数据进行清洗和处理。

- **D: 有些箱子可能没有数据**
- 正确。由于等宽装箱法基于固定范围分割数据,如果数据在某些范围内没有出现,则可能会导致某些箱子为空。这是等宽装箱法的一个潜在问题,尤其是在数据分布不均的情况下容易出现。

### 总结

等宽装箱法简单且运行效率高,但在数据分布不均时可能会导出许多空箱或一些箱里数据过多,而其他箱子里数据过少的情况。相反,等频装箱法则每个箱子内的数据量是相同的,可能更好地保持分布的均衡性。