考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

变量转换有分布形态转换和中心标准化、归一化、WoE编码等,回答下列问题。 以下哪个说法最准确描述了这段代码的功能? grouped['WoE'] = np.log((grouped['good'] / total_good) / (grouped['bad'] / total_bad))
A. 用于连续型变量的降维
B. 将非数值变量转换为数值变量
C. 对变量进行中心标准化处理
D. 对变量进行等深分箱处理
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

代码基于每个类别的好客户和坏客户的比例计算了WoE值。

正确答案是:B: 将非数值变量转换为数值变量

专业分析:
这段代码实现了WoE(Weight of Evidence)编码,它是一种将分类变量转换为数值变量的方法。具体来说,WoE编码通过计算每个类别的“好”样本和“坏”样本的比例,并取其对数来实现。这个过程可以帮助模型更好地捕捉不同类别之间的差异。

代码解释:
```python
grouped['WoE'] = np.log((grouped['good'] / total_good) / (grouped['bad'] / total_bad))
```
- `grouped['good'] / total_good`:计算每个类别中的“好”样本占总“好”样本的比例。
- `grouped['bad'] / total_bad`:计算每个类别中的“坏”样本占总“坏”样本的比例。
- `np.log(...)`:对上述两个比例的比值取对数,得到每个类别的WoE值。

因此,这段代码的功能是将分类变量转换为数值变量,以便于后续的建模和分析。选项A、C和D都不涉及将非数值变量转换为数值变量,所以不正确。