考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

缺失值是指粗糙数据中由于缺少信息而造成的数据删失或截断等问题。缺失值(NULL Value)的处理是在知识发掘处理(Knowledge Discovery Process)中的那一个阶段?
A. 数据清洗
B. 数据选择
C. 数据编码
D. 数据扩充
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

缺失值处理是数据清洗工作的一环。

正确答案是:A: 数据清洗

专业分析:
在知识发掘处理(Knowledge Discovery Process)过程中,缺失值(NULL Value)的处理通常是在数据清洗阶段进行的。数据清洗是数据预处理的一部分,旨在处理数据中的噪声、错误、重复和缺失值等问题。具体来说,数据清洗阶段包括以下几个步骤:

1. **识别缺失值**:首先,识别数据集中哪些值是缺失的。
2. **处理缺失值**:然后,根据具体情况采取相应的方法处理缺失值,如删除包含缺失值的记录、用其他值(如均值、中位数或最常见值)替换缺失值,或者使用插值和预测模型填补缺失值。

其他选项的分析:
B: 数据选择——数据选择阶段主要是从原始数据集中选择与分析任务相关的数据子集。
C: 数据编码——数据编码阶段涉及将数据转换为适合分析的格式,可能包括将分类数据转换为数值数据等。
D: 数据扩充——数据扩充阶段涉及通过增加数据量或生成新的数据特征来丰富数据集。

因此,缺失值的处理主要是在数据清洗阶段进行的。