正确答案是:A: 数据清洗
### 专业分析:
在知识发掘处理(Knowledge Discovery Process)过程中,处理错误值(Wrong Value)通常属于数据预处理的任务,而数据清洗是数据预处理的一个关键阶段。以下是对各个选项的分析:
1. **数据清洗(Data Cleaning)**:
- **定义**:数据清洗是指识别、修正或删除数据中的错误(例如:输入错误、缺失值、重复数据等),以提高数据质量。
- **任务**:包括处理错误值、缺失值、重复数据、不一致数据等。
- **定位**:由于错误值直接影响数据的准确性,数据清洗阶段是处理这些错误值的关键所在。
2. **数据选择(Data Selection)**:
- **定义**:从大量的原始数据集中选择与分析目标相关的数据。
- **任务**:基于特定的标准或需求选择数据子集。
- **定位**:此阶段不直接处理数据中的错误值。
3. **数据编码(Data Transformation/Encoding)**:
- **定义**:将数据转换为适合建模的格式,通常涉及数据的规范化、离散化和编码。
- **任务**:对数据进行转换,使之适应机器学习算法的需求。
- **定位**:主要关注数据格式的转换与编码,不针对错误值的处理。
4. **数据扩充(Data Augmentation)**:
- **定义**:通过生成新数据来增加数据集的规模,以提高模型的泛化能力。
- **任务**:主要在图像处理、自然语言处理中使用,通过扰动、变换原始数据生成新样例。
- **定位**:此阶段与错误值处理无关。
综上所述,错误值的处理属于数据清洗阶段,因为这一阶段专门针对数据质量问题进行处理,包括但不限于错误值的修正和去除。