考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

一份有关车贷审核的数据中,关于是否放贷的问题,收集到客户的年龄、学历、年收入、年支出、五年内是否有违约记录这些信息,试建立逻辑回归模型。(5)以上影响因素中,必须做哑变量处理的是?
A. 年龄
B. 学历
C. 五年内是否有违约记录
D. 年支出
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

在建模中分类变量一般需要做哑变量处理,故答案为B。

在建立逻辑回归模型时,哑变量处理(也称为虚拟变量处理)通常用于处理分类变量,以便将其转换为模型可以处理的数值形式。

对于您列出的影响因素:

A: 年龄 - 这是一个连续变量,不需要做哑变量处理。
B: 学历 - 这是一个分类变量(如高中、本科、硕士等),需要做哑变量处理。
C: 五年内是否有违约记录 - 这是一个二元分类变量(是/否),可以直接使用0和1表示,不需要进一步的哑变量处理。
D: 年支出 - 这是一个连续变量,不需要做哑变量处理。

因此,正确答案是:B: 学历。

**专业分析:**

1. **年龄和年支出**:这两个变量是连续的数值型变量,可以直接用于逻辑回归模型,不需要进行哑变量处理。

2. **学历**:学历是一个多类别的分类变量(例如,高中、专科、本科、硕士、博士等),在逻辑回归模型中,分类变量需要转换成哑变量。例如,如果有三个类别(高中、本科、硕士),可以用两个哑变量来表示:一个表示是否为本科,另一个表示是否为硕士,高中作为基准类别。

3. **五年内是否有违约记录**:这是一个二元分类变量(是/否),可以直接用0和1表示。虽然技术上它也是一个分类变量,但因为它只有两个类别,所以不需要进一步的哑变量处理。

因此,只有学历这个变量需要进行哑变量处理,以便在逻辑回归模型中使用。