考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

在使用机器学习算法训练模型时需要先对数据进行特征工程处理例如:统一数据量纲、对数据进行编码等,以下方法可以改变数据量纲的是( )
A. 对数据做归一化处理
B. 对数据做z-score标准化
C. 对数据取对数
D. 以上都是
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

选项A中归一化的目的是让数据压缩在【0,1】范围内;选项B中z-score标准化针对数据进行了压缩大小处理,同时还让数据具有特殊特征(平均值为0标准差为1);选项C中取对数之后不会改变数据的性质和相关关系,但压缩了变量的尺度,使数据更加平稳,因此选项ABC都可以改变数据量纲,本题选D

正确答案是D: 以上都是。

**专业分析:**

1. **归一化处理(Normalization)**:
- 归一化是将数据按比例缩放到一个特定的范围(通常是0到1之间)。常见的方法是最小-最大归一化。
- 公式:\( X_{norm} = \frac{X - X_{min}}{X_{max} - X_{min}} \)
- 这种方法可以改变数据的量纲,使得不同特征的数据在同一个尺度上。

2. **z-score标准化(Z-score Standardization)**:
- z-score标准化是将数据转换为均值为0、标准差为1的标准正态分布。
- 公式:\( X_{std} = \frac{X - \mu}{\sigma} \)
- 这种方法也改变了数据的量纲,使得特征值的分布具有相同的尺度。

3. **取对数(Log Transformation)**:
- 对数变换是对数据进行对数运算,通常用于处理具有幂律分布或长尾分布的数据。
- 公式:\( X_{log} = \log(X) \)
- 取对数可以压缩数据的范围,改变数据的量纲,并且可以使得数据的分布更加接近正态分布。

综上所述,A、B、C三种方法都可以改变数据的量纲,因此正确答案是D: 以上都是。