考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

数据清洗阶段,对于以下()处理方式可以用来处理缺失值? ①用均值填充②转换为哑变量(0,1),代表数据是否缺失③使用回归模型去预测缺失值
A. ①②③
B. ②③
C. ①③
D. ①②
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

本题考查缺失值处理方法。常见的处理缺失值的方法有用均值填充、使用哑变量(0,1)代表数据是否缺失、使用回归模型去预测缺失值等,因此本题选A。

正确答案是A: ①②③。

专业分析:

1. **用均值填充**:这是最常见的处理缺失值的方法之一,特别适用于数值型数据。通过计算已有数据的均值并用其填充缺失值,可以在不引入过多偏差的情况下保留数据的整体趋势。

2. **转换为哑变量(0,1),代表数据是否缺失**:这种方法适用于分类变量。通过将缺失情况编码为二进制变量(0表示数据存在,1表示数据缺失),可以在后续的分析中考虑缺失信息的影响。

3. **使用回归模型去预测缺失值**:这是较为复杂但也较为精确的方法之一。通过构建回归模型,可以利用其他特征的信息来预测缺失值,从而填补数据。这种方法特别适用于数据量较大且特征间关系较强的情况。

综上所述,这三种方法都可以用于处理缺失值,因此答案是A: ①②③。