考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

字段“户籍所在省份”,下列方法最适宜的是( )
A. 需要编码为数值变量
B. 需要编码为字符变量
C. 需要编码为二分变量
D. 需要编码为分类变量
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

省份更适合用分类变量。

正确答案是D: 需要编码为分类变量。

分析:
- 户籍所在省份是一个典型的分类变量(categorical variable)。它表示的是一个类别,而不是一个数值或二分变量。
- 编码为数值变量(A)不合适,因为省份之间没有自然的数值关系或顺序。
- 编码为字符变量(B)可以用来表示省份的名称,但在数据分析和建模中,通常需要将字符变量转换为机器学习算法可以理解的格式,如分类变量。
- 编码为二分变量(C)不合适,因为二分变量通常只用于只有两个类别的情况,而中国的省份有多个。
- 编码为分类变量(D)是最合适的选择,因为它允许我们将每个省份作为一个独立的类别进行处理,适合用于后续的统计分析或机器学习模型中。常见的方法是使用独热编码(one-hot encoding)将其转换为数值格式。