数据正规化(Data Normalization)通常是在数据预处理阶段进行的,而数据预处理是数据准备过程中的一个关键步骤。就你提供的选项来看,数据正规化最适合归类于数据清洗(A)。以下是对各个选项的分析:
A: 数据清洗
- 数据清洗的目的是处理数据中的噪声和不一致性,包括处理缺失值、重复数据和异常值。数据正规化可以被视为数据清洗的一部分,因为它涉及将数据调整到一个共同的尺度,以便于后续分析和建模。
B: 数据选择
- 数据选择涉及从原始数据集中选择相关的数据子集,以便进行进一步分析。这一阶段通常不涉及对数据值的变换或缩放。
C: 数据编码
- 数据编码通常涉及将分类数据转换为数值形式,以便可以用于机器学习算法。虽然这也是数据预处理的一部分,但它与数据正规化的目标不同。
D: 数据扩充
- 数据扩充通常用于生成更多的训练数据,特别是在机器学习和深度学习中以提高模型的泛化能力。数据正规化与数据扩充的目标和方法都不相同。
因此,数据正规化最符合数据清洗阶段的工作内容。正确答案是A: 数据清洗。