考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

数据清洗包括处理缺失值、异常值、重复值等脏数据,处理每种脏数据的方法也是多种多样。以下哪些处理方式可以用来处理缺失值?① 用均值填充② 转换为哑变量(0,1),代表数据是否缺失③ 使用回归模型去预测缺失值
A. ①②③
B. ②③
C. ①③
D. ①②
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

常见处理缺失值的方法有:1.用单一值填充;2.把缺失值当做一类;3. 建立模型进行预测,4. 多重插补,①②③都符合,本题选A

正确答案是A: ①②③。

以下是专业分析:

1. **用均值填充**:这是最常见的处理缺失值的方法之一。对于数值型数据,可以用该变量的均值来填充缺失值,以减少数据偏差。

2. **转换为哑变量(0,1),代表数据是否缺失**:这是另一种处理缺失值的方法。通过创建一个新的二进制变量(哑变量),可以标识原始数据中哪些值是缺失的。这种方法在后续建模中可以帮助模型识别缺失数据的模式。

3. **使用回归模型去预测缺失值**:这是较为高级的方法,通过构建回归模型来预测缺失值。利用其他相关变量的信息,可以较为准确地估计出缺失值。

综上所述,这三种方法都可以用来处理缺失值,因此答案是A: ①②③。