A选项错误:PCA的目标是最大化方差,第一个主成分包含的信息量(方差贡献率)通常是最大的,而不是最小。
B选项正确:当原始变量的量纲(单位)不一致或数值范围差异很大时(如销售额可能是几万,而退货率是0-1之间的小数),协方差矩阵会被大数值变量主导。因此,必须先进行标准化处理,使各变量均值为0、方差为1,基于相关系数矩阵进行PCA。
C选项错误:PCA的核心目的正是降维。通常会选取累计方差贡献率达到一定阈值(如85%或90%)的前几个主成分,数量通常远少于原始变量数。
D选项错误:初始主成分往往是原始变量的复杂线性组合,业务含义通常不直观。在实际应用中,常需进行因子旋转(如方差最大旋转)以使载荷矩阵结构更简单,从而便于解释和命名。
故选B。