在建模中分类变量一般需要做哑变量处理,故答案为B。
在建立逻辑回归模型时,哑变量处理(也称为虚拟变量处理)通常用于处理分类变量,以便将其转换为模型可以处理的数值形式。
对于您列出的影响因素:
A: 年龄 - 这是一个连续变量,不需要做哑变量处理。
B: 学历 - 这是一个分类变量(如高中、本科、硕士等),需要做哑变量处理。
C: 五年内是否有违约记录 - 这是一个二元分类变量(是/否),可以直接使用0和1表示,不需要进一步的哑变量处理。
D: 年支出 - 这是一个连续变量,不需要做哑变量处理。
因此,正确答案是:B: 学历。
**专业分析:**
1. **年龄和年支出**:这两个变量是连续的数值型变量,可以直接用于逻辑回归模型,不需要进行哑变量处理。
2. **学历**:学历是一个多类别的分类变量(例如,高中、专科、本科、硕士、博士等),在逻辑回归模型中,分类变量需要转换成哑变量。例如,如果有三个类别(高中、本科、硕士),可以用两个哑变量来表示:一个表示是否为本科,另一个表示是否为硕士,高中作为基准类别。
3. **五年内是否有违约记录**:这是一个二元分类变量(是/否),可以直接用0和1表示。虽然技术上它也是一个分类变量,但因为它只有两个类别,所以不需要进一步的哑变量处理。
因此,只有学历这个变量需要进行哑变量处理,以便在逻辑回归模型中使用。