A是因子分析的工作,B应为特征向量的方向对应的是数据变异最大的方向,C应为特征根大于1,而不是之和大于1
关于主成分分析(Principal Component Analysis, PCA)的描述,正确的选项是 D。以下是对每个选项的专业分析:
A: 主成分分析的本质就是找到解释变量的公共因子和特殊因子
错误。主成分分析的本质是通过线性变换将原始变量转换为一组彼此不相关的新变量(主成分),这些新变量按方差大小排序,使得前几个主成分能够解释数据的大部分变异。公共因子和特殊因子的概念属于因子分析(Factor Analysis),而不是主成分分析。
B: 在主成分分析中,对应最大特征值的特征向量,其方向正是协方差矩阵变异最小的方向
错误。在主成分分析中,对应最大特征值的特征向量,其方向是协方差矩阵变异最大的方向。相反,对应最小特征值的特征向量才是变异最小的方向。
C: 我们一般只保留的前k个主成分,其对应主成分特征根之和大于1就可以了
错误。保留前k个主成分的标准通常是根据累计解释的变异比例,而不是特征根之和大于1。特征根之和大于1不是一个通用的标准。
D: 我们一般使得保留的前k个主成分累计能够解释数据80%以上的变异
正确。通常在主成分分析中,我们希望保留的前k个主成分能够解释数据的大部分变异,通常选择累计解释变异比例达到80%以上的主成分。
因此,正确答案是 D。