新用户注册
备考刷题,请到
CDA认证小程序
皮尔逊相关系数主要衡量两个变量间的线性相关程度,且对异常值和偏态分布非常敏感。当数据严重偏态或存在非线性关系(如曲线)时,皮尔逊系数往往不能真实反映变量间的关联强度(可能低估)。此时,正确的做法是对偏态数据进行变换(如对数变换使其接近正态分布)后再分析,或者使用不依赖分布假设的斯皮尔曼(Spearman)等级相关系数。直接剔除数据(D)缺乏依据,认为完全无关(A)或适用非线性(B)均错误。故选C。