考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

在数据清洗阶段,发现某连续变量(如“用户年龄”)中存在值为 200 的样本,这明显超出了正常人类寿命范围。根据数据问题分类,这属于哪类问题?
A. 单变量数据分布问题
B. 两变量间关系问题
C. 单变量数据问题中的连续变量异常值
D. 时间序列的噪音值
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

题目描述的是单个连续变量中出现的明显不合理数值(离群值/异常值),属于“单变量数据问题”中的“连续变量异常值”。此类问题通常与后续采用何种算法无关,是基础的数据质量问题。