考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

错误值(Wrong Value)的处理是在知识发掘处理(Knowledge Discovery Process)中的哪一个阶段?
A. 数据清洗
B. 数据选择
C. 数据编码
D. 数据扩充
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

正确答案是:A: 数据清洗

### 专业分析:

在知识发掘处理(Knowledge Discovery Process)过程中,处理错误值(Wrong Value)通常属于数据预处理的任务,而数据清洗是数据预处理的一个关键阶段。以下是对各个选项的分析:

1. **数据清洗(Data Cleaning)**:
- **定义**:数据清洗是指识别、修正或删除数据中的错误(例如:输入错误、缺失值、重复数据等),以提高数据质量。
- **任务**:包括处理错误值、缺失值、重复数据、不一致数据等。
- **定位**:由于错误值直接影响数据的准确性,数据清洗阶段是处理这些错误值的关键所在。

2. **数据选择(Data Selection)**:
- **定义**:从大量的原始数据集中选择与分析目标相关的数据。
- **任务**:基于特定的标准或需求选择数据子集。
- **定位**:此阶段不直接处理数据中的错误值。

3. **数据编码(Data Transformation/Encoding)**:
- **定义**:将数据转换为适合建模的格式,通常涉及数据的规范化、离散化和编码。
- **任务**:对数据进行转换,使之适应机器学习算法的需求。
- **定位**:主要关注数据格式的转换与编码,不针对错误值的处理。

4. **数据扩充(Data Augmentation)**:
- **定义**:通过生成新数据来增加数据集的规模,以提高模型的泛化能力。
- **任务**:主要在图像处理、自然语言处理中使用,通过扰动、变换原始数据生成新样例。
- **定位**:此阶段与错误值处理无关。

综上所述,错误值的处理属于数据清洗阶段,因为这一阶段专门针对数据质量问题进行处理,包括但不限于错误值的修正和去除。