考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

在MNIST数据集中包含了从0-9数字的手写体图像,初始图像是28像素*28像素,我们希望构建预测模型预测图像中的数字,请根据题干回答以下问题 (2)请问选项中不是PCA转换计算流程的步骤是
A. 样本集标准化
B. 样本集矩阵中心化
C. 计算样本矩阵的协方差矩阵C
D. 求样本集矩阵的协方差矩阵的特征值和特征向量
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

无解析

正确答案是:A: 样本集标准化

**分析:**

PCA(主成分分析)是一种常用的数据降维技术,它的主要步骤如下:

1. **样本集矩阵中心化**:将数据集中的每个特征减去其均值,使数据集的均值为0。
2. **计算样本矩阵的协方差矩阵**:计算中心化后的数据集的协方差矩阵。
3. **求样本集矩阵的协方差矩阵的特征值和特征向量**:通过特征值分解得到协方差矩阵的特征值和特征向量。
4. **选择主要成分**:根据特征值的大小选择主要成分(特征向量)。
5. **转换数据**:将原始数据投影到选择的主要成分上,得到降维后的数据。

在这些步骤中,样本集标准化(即将数据缩放到相同的尺度,如0到1或标准正态分布)不是PCA转换计算流程的必要步骤。虽然标准化可以在某些情况下提高PCA的效果,但它不是PCA算法的必需步骤。标准化通常用于处理不同特征尺度差异较大的数据集,而PCA的核心步骤是中心化、计算协方差矩阵和特征值分解等。

因此,选项A: 样本集标准化,不是PCA转换计算流程的步骤。