考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

一份有关车贷审核的数据中,关于是否放贷的问题。收集到客户的年龄、学历、年收入、年支出、五年内是否有违约记录这些信息。试建立逻辑回归模型。(5)以上影响因素中,必须做哑变量处理的是?
A. 年龄
B. 学历
C. 五年内是否有违约记录
D. 年支出
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

在建模中分类变量一般需要做哑变量处理,故答案为B。

在建立逻辑回归模型时,哑变量(Dummy Variable)处理通常用于将类别变量转换为数值变量,以便模型能够处理这些信息。在你提供的选项中:

A: 年龄 —— 这是一个连续变量,不需要做哑变量处理。
B: 学历 —— 这是一个类别变量,需要做哑变量处理。
C: 五年内是否有违约记录 —— 这是一个二元变量(是/否),通常可以直接用于逻辑回归模型,不需要额外的哑变量处理。
D: 年支出 —— 这是一个连续变量,不需要做哑变量处理。

因此,正确答案是 **B: 学历**。

### 专业分析
1. **年龄和年支出**:这些是连续变量,可以直接用于逻辑回归模型,不需要进行哑变量处理。
2. **学历**:学历通常是一个类别变量(如高中、大学、研究生等),需要转换为哑变量。例如,如果有三种学历水平,可以创建两个哑变量来表示这三种情况。
3. **五年内是否有违约记录**:这是一个二元变量(是/否),可以直接用0和1表示,不需要额外的哑变量处理。

哑变量处理的目的是将类别变量转换为数值形式,使得逻辑回归模型能够处理这些信息并进行有效的预测。