考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

以下几项中,可以归于知识发掘处理(Knowledge Discovery Process)中的数据清洗阶段的有()
A. 异常值处理
B. 缺失值处理
C. 预测结果可视化输出
D. 理解业务背景
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

数据清洗是指发现并纠正数据文件中可识别的错误的最后一道程序,包括检查数据一致性,处理无效值和缺失值等

正确答案是:A: 异常值处理 和 B: 缺失值处理。

专业分析:
数据清洗(Data Cleaning)是知识发掘处理(Knowledge Discovery Process)中的一个重要阶段,主要目的是确保数据的质量和一致性。数据清洗阶段的主要任务包括:

1. **异常值处理(Outlier Handling)**:这一步是为了识别和处理数据中的异常值,即那些明显偏离其他数据点的值。异常值可能是由于数据输入错误、测量误差或其他原因引起的。

2. **缺失值处理(Missing Value Handling)**:这一步是为了处理数据集中缺失的部分。缺失值可能会影响数据分析的结果,因此需要通过删除、填补或插值等方法进行处理。

C: 预测结果可视化输出 和 D: 理解业务背景 不属于数据清洗阶段的任务。预测结果可视化输出属于数据挖掘过程中的结果展示阶段,而理解业务背景则是知识发掘过程中的初始阶段,旨在明确问题和目标。

因此,A和B是数据清洗阶段的典型任务。