考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

字段“贷款人姓名”,下列方法最适宜的是( )
A. 需要编码为数值变量
B. 需要编码为字符变量
C. 需要编码为二分变量
D. 需要编码为分类变量
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

字符型变量适合姓名。

正确答案是D: 需要编码为分类变量。

专业分析:

1. **字段性质**:贷款人姓名是一个典型的分类变量(categorical variable)。它代表了不同的类别(即不同的贷款人),而不是一个连续的数值或二分的状态。

2. **编码为数值变量**:编码为数值变量通常适用于连续型数据,例如年龄、收入等。贷款人姓名不具备数值的连续性,因此不适宜编码为数值变量。

3. **编码为字符变量**:虽然贷款人姓名本质上是字符数据,但在数据分析和建模中,字符变量通常需要进一步处理,以便用于算法中。直接作为字符变量可能无法直接参与大多数统计和机器学习模型的计算。

4. **编码为二分变量**:二分变量(binary variable)适用于仅有两个类别的情况,例如是/否、真/假等。贷款人姓名通常有多个不同的名字,因此不适合编码为二分变量。

5. **编码为分类变量**:分类变量适合用于处理具有多个类别的非数值数据。在数据分析中,通常使用独热编码(one-hot encoding)或标签编码(label encoding)将分类变量转换为模型可以处理的数值形式。因此,贷款人姓名应被编码为分类变量以便于模型处理和分析。