考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

变量转换有分布形态转换和中心标准化、归一化、WoE编码等,回答下列问题。 对于连续变量在WoE编码之前可以先做分箱。 分箱方法中的等宽分箱特点是什么?
A. 每个分箱中的样本量一致
B. 每个分箱中的取值范围一致
C. 基于变量的百分位秩
D. 基于Tukey正态分布打分
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

等宽分箱方法的主要特点是每个箱子包含相同范围的值,这与等深分箱不同,后者强调每个箱子内有相同数量的观察值。

正确答案是:B: 每个分箱中的取值范围一致。

**专业分析:**

等宽分箱(Equal-width Binning)是一种常见的分箱方法,其特点是将连续变量的取值范围划分为若干个宽度相等的区间。具体来说:

- **等宽分箱特点**:每个分箱的取值范围(即区间宽度)是相等的。例如,如果一个变量的取值范围是0到100,并且我们希望将其分成5个等宽的分箱,那么每个分箱的取值范围将是0-20, 20-40, 40-60, 60-80, 80-100。
- **示例**:假设有一个变量的取值范围为[0, 100],我们希望将其分成5个等宽的区间,则每个区间的宽度为(100-0)/5 = 20。因此,分箱后的区间为[0, 20), [20, 40), [40, 60), [60, 80), [80, 100]。

其他选项的解释:

- **A: 每个分箱中的样本量一致**:这是等频分箱(Equal-frequency Binning)的特点,即每个分箱中的样本数量是相等的。
- **C: 基于变量的百分位秩**:这是基于百分位数分箱的方法,通常用于等频分箱。
- **D: 基于Tukey正态分布打分**:这是指Tukey的箱线图方法,用于检测数据中的异常值,与等宽分箱无关。

综上所述,等宽分箱的特点是每个分箱中的取值范围一致,因此正确答案是B。