考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

缺失值处理属于的那一个阶段?
A. 业务理解
B. 建模预测
C. 数据清洗
D. 模型修正
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

正确答案是:C: 数据清洗

### 专业分析

在数据分析和机器学习流程中,数据处理是一个至关重要的阶段。整个流程通常可以概括为以下几个阶段:

1. **业务理解**:
- 这是最初阶段,旨在理解业务需求和目标。此时不涉及数据操作。

2. **数据收集**:
- 收集相关的数据,以供后续分析和建模使用。

3. **数据清洗**:
- 这个阶段处理收集到的数据,使之具备可用性。主要任务包括:
- 处理缺失值:缺失值会导致数据分析结果不准确,因此在此阶段需要识别和处理这些缺失值。
- 处理异常值、重复数据和不一致的数据格式等问题。

4. **探索性数据分析(EDA)**:
- 进行初步的数据分析,以发现数据中的模式、关系和特征。

5. **特征工程**:
- 提取和转换数据中的特征,以便更好地输入模型。例如,数据标准化、独热编码等。

6. **建模预测**:
- 使用清洗和准备好的数据来训练机器学习模型。

7. **模型评估与选择**:
- 评估模型的性能,并选择最佳模型进行部署。

8. **模型修正与优化**:
- 对模型进行调整和优化,以提高其性能。

综上所述,缺失值的处理是数据治理中的一个子任务,通常属于数据清洗环节。在数据清洗中,缺失值可以通过删除、插值、填充等方法来处理,以保障数据分析和模型训练的质量。