考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

在数据清洗中,某连续型变量的缺失值比例超过80%,以下处理方式最符合专业原则的是:
A. 用均值填补缺失值并生成指示哑变量
B. 仅用中位数填补缺失值且不生成哑变量
C. 生成指示哑变量参与建模,原始变量不再使用
D. 直接删除该变量以避免对模型产生干扰
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

根据教材,当缺失值比例超过80%时,正确的处理方式是生成一个指示哑变量(标记缺失状态),原始变量不再参与建模。选项C符合这一原则。选项A错误:均值填补适用于缺失值少于20%的情况,且80%以上缺失时不建议继续填补。选项B错误:填补方法不适用于高比例缺失场景,且未生成哑变量。选项D错误:材料未提及直接删除变量,而是强调通过哑变量保留缺失信息。