考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

在实际数据分析工作中,关于等级变量(有序分类变量)的处理,下列说法正确的是:
A. 等级变量绝对不能当作连续变量处理,否则会导致分析结果完全错误。
B. 当等级变量的水平数量过多(一般建议阈值超过20)时,可以选择将其“概化”或直接当作连续变量处理。
C. Python 能够自动识别等级变量与连续变量的区别,无需数据分析师进行任何特别声明。
D. 周岁年龄本质上是连续变量,因此在任何情况下都不需要对其进行“概化”处理。
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

A错误:实际工作中我们会不自主地这样做(当作连续变量),且由分析师决定,并非绝对不能。 B正确:等级变量的水平数量超过多少算作连续变量,是由数据分析师自己决定的,不过一般的建议阈值是20,且过多水平可选择“概化”或当作连续变量。 C错误:“Python在统计功能上并不完善,如果不特别声明,Python会把所有数值变量当作连续变量来处理”,说明Python不能自动识别。 D错误:教材中提到过:周岁年龄...本质上这个变量是一个多水平的等级变量,只是通常被当作连续变量处理,而非本质就是连续变量。