新用户注册
备考刷题,请到
CDA认证小程序
A. 错误。平均值法认为 SR > 2 的数据为离群值,适用于观察值较少的数据集,而非观察值较多的数据集。 B. 错误。四分位数法定义的离群值范围是 Q1 – 1.5 × IQR 到 Q3 + 1.5 × IQR,而非 Q1 – 2 × IQR 到 Q3 + 2 × IQR。 C. 正确。盖帽法是将连续变量均值上下三倍标准差范围外的记录替换为均值上下三倍标准差值,即盖帽处理。 D. 错误。离群值和错误值在实际操作中很难区分,因为识别这两类问题使用的分析手段是相同的。