考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

标准化只是将原始数据进行线性变换,没有改变数据的分布形态,只是使数据的均值变为_____,标准差变为_____ ( )
A. 0, 1 
B. 1, 0
C. 0, 0
D.  1, 1
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

正确答案是:A: 0, 1。

### 分析:

**标准化(Z-score 标准化)**是数据预处理中的一种常见方法,其主要目的是对特征进行尺度缩放,使得处理后的数据具有特定的均值和标准差。具体来说:

- **均值变为 0**:
标准化的过程会将数据的均值调整为 0。这是通过从每个数据点中减去原始数据的均值实现的。

- **标准差变为 1**:
标准化的过程同时也将数据的标准差缩放为 1。这是通过将每个数据点减去均值后的结果再除以原始数据的标准差实现的。

### 方法概述:

假设原始数据集为 \( X \),其均值和标准差分别为 \( \mu \) 和 \( \sigma \)。标准化后的数据集 \( Z \) 的计算公式为:

\[ Z = \frac{X - \mu}{\sigma} \]

- **步骤说明**:
1. 计算原始数据的均值 \( \mu \)。
2. 计算原始数据的标准差 \( \sigma \)。
3. 对每个数据点 \( x \) 应用公式进行标准化。

### 示例:

假设原始数据集为:[2, 4, 6, 8, 10]

- 计算均值 \( \mu = 6 \)
- 计算标准差 \( \sigma = 2.83 \) (近似值)
- 标准化后的数据集:
- \( Z_1 = \frac{2-6}{2.83} \approx -1.41 \)
- \( Z_2 = \frac{4-6}{2.83} \approx -0.71 \)
- \( Z_3 = \frac{6-6}{2.83} = 0 \)
- \( Z_4 = \frac{8-6}{2.83} \approx 0.71 \)
- \( Z_5 = \frac{10-6}{2.83} \approx 1.41 \)

标准化处理是保证不同特征在同一数值尺度上进行比较分析,尤其是在机器学习算法(如K-means、PCA等)中非常重要。