考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

数据的规范化有()(多选)
A. max-min
B. 独热编码
C. 分箱
D. 标准化
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

规范化是将属性数据按比例缩放,使之落入一个小的特定区间,方法有:最大最小化、标准化、小数定标规范化

数据的规范化通常是指将数据调整到一定的范围或分布,以便于后续的分析和建模。在你的选项中,以下是涉及数据规范化的:

A: max-min - 这是一个规范化方法,也称为最小-最大缩放。它将数据缩放到一个特定的范围(通常是0到1),通过以下公式实现:
\[ x' = \frac{x - \text{min}(x)}{\text{max}(x) - \text{min}(x)} \]
因此,A是正确的。

D: 标准化 - 这也是一种规范化方法,通常是指将数据调整为均值为0,标准差为1的分布。标准化通过以下公式实现:
\[ x' = \frac{x - \mu}{\sigma} \]
其中,\(\mu\)是均值,\(\sigma\)是标准差。因此,D也是正确的。

B: 独热编码 - 这是一个编码方法,用于将分类数据转换为二进制向量形式。它不是一种规范化方法,而是一种数据预处理技术。因此,B不是正确的。

C: 分箱 - 这是将连续数据分成离散区间的过程,通常用于减少数据的噪声或处理异常值。虽然它可以改变数据的表示形式,但不属于严格意义上的规范化方法。因此,C不是正确的。

综上所述,正确答案是A和D。