考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

对于缺失值,以下说法正确的是?
A. 所有的有监督学习模型都不支持有缺失值的情况
B. 遇到有缺失值的情况,优先考虑删除变量
C. 对于分类数据,考虑使用均值填充
D. 对于连续型数据,考虑使用均值填充
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

在处理缺失值时,以下是对每个选项的分析:

A: **所有的有监督学习模型都不支持有缺失值的情况**
这个说法是不正确的。一些模型(如决策树和随机森林)在某种程度上可以处理缺失值,而其他模型则需要在训练前对缺失值进行处理。

B: **遇到有缺失值的情况,优先考虑删除变量**
这个说法不是最优的方法。删除含有缺失值的变量可能会导致数据丢失重要信息。通常,只有在缺失值比例极高且变量重要性低时才考虑删除。

C: **对于分类数据,考虑使用均值填充**
这个说法不正确。分类数据通常使用众数(mode)进行填充,而不是均值。

D: **对于连续型数据,考虑使用均值填充**
这个说法是正确的。对于连续型数据,均值填充是一种常见且简单的处理缺失值的方法,但也可以考虑其他更复杂的方法如插值、预测模型填补等。

总结:
正确答案是 **D**。对于连续型数据,使用均值填充是常见的方法,但需根据具体情况和数据特性选择最合适的方法。