考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

根据数据问题的分类体系,下列哪些情况属于“单变量数据问题”,且通常被认为与后续采用何种具体算法没有直接关系(即属于通用数据质量问题)?
A. 连续变量中存在明显的离群值(如年龄为200岁)
B. 分类变量中包含出现频率极低的稀有水平
C. 两个连续解释变量之间存在高度线性相关(多重共线性)
D. 数据集中存在大量的缺失值或单一值列
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

根据题干知识点: A、B、D 均属于“(1)单变量数据问题”中列出的内容(连续变量异常值、分类变量稀有水平/错误值、缺失值/单一值),且CDALEVELⅡ教材明确指出“总的来说,此类问题与后续采用何种算法没有关系”。 C 属于“(3)两变量间关系问题”。