考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

在MNIST数据集中包含了从0-9数字的手写体图像,初始图像是28像素*28像素,我们希望构建预测模型预测图像中的数字,请根据题干回答以下问题 (2)请问选项中不是PCA转换计算流程的步骤是
A. 样本集标准化
B. 样本集矩阵中心化
C. 计算样本矩阵的协方差矩阵C
D. 求样本集矩阵的协方差矩阵的特征值和特征向量
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

在PCA(主成分分析)的计算流程中,以下是标准的步骤:

1. **样本集标准化**:将数据标准化,使得每个特征具有均值为0,方差为1。这一步是为了消除不同特征之间的量纲差异。
2. **样本集矩阵中心化**:将每个特征的均值减去,使得数据中心化,即每个特征的均值为0。
3. **计算样本矩阵的协方差矩阵**:计算中心化后的样本矩阵的协方差矩阵,以了解各特征之间的线性关系。
4. **求协方差矩阵的特征值和特征向量**:计算协方差矩阵的特征值和特征向量,以确定主成分的方向和重要性。
5. **选择主要特征向量**:根据特征值的大小选择主要的特征向量,通常选择特征值较大的前k个特征向量。
6. **转换数据**:将原始数据投影到选择的主要特征向量上,从而得到降维后的数据。

根据上述步骤,选项中不是PCA转换计算流程的步骤是:
B: 样本集矩阵中心化

正确答案是:B。样本集矩阵中心化是PCA流程中的一个重要步骤,不是一个非必要步骤。