规范化是将属性数据按比例缩放,使之落入一个小的特定区间,方法有:最大最小化、标准化、小数定标规范化
数据的规范化通常是指将数据调整到一定的范围或分布,以便于后续的分析和建模。在你的选项中,以下是涉及数据规范化的:
A: max-min - 这是一个规范化方法,也称为最小-最大缩放。它将数据缩放到一个特定的范围(通常是0到1),通过以下公式实现:
\[ x' = \frac{x - \text{min}(x)}{\text{max}(x) - \text{min}(x)} \]
因此,A是正确的。
D: 标准化 - 这也是一种规范化方法,通常是指将数据调整为均值为0,标准差为1的分布。标准化通过以下公式实现:
\[ x' = \frac{x - \mu}{\sigma} \]
其中,\(\mu\)是均值,\(\sigma\)是标准差。因此,D也是正确的。
B: 独热编码 - 这是一个编码方法,用于将分类数据转换为二进制向量形式。它不是一种规范化方法,而是一种数据预处理技术。因此,B不是正确的。
C: 分箱 - 这是将连续数据分成离散区间的过程,通常用于减少数据的噪声或处理异常值。虽然它可以改变数据的表示形式,但不属于严格意义上的规范化方法。因此,C不是正确的。
综上所述,正确答案是A和D。