考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

在数据分析中经常遇到离群数据,会影响模型的稳定性,关于离群值的识别和处理,以下哪一项描述是正确的?
A. 平均值法认为 SR > 2 的数据为离群值,适用于观察值较多的数据集。
B. 四分位数法定义的离群值范围是 Q1 – 2 × IQR 到 Q3 + 2 × IQR。
C. 将连续变量均值上下三倍标准差范围外的记录替换为均值上下三倍标准差值属于盖帽法。
D. 离群值和错误值在实际操作中可以通过不同的分析手段轻松区分。
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

A. 错误。平均值法认为 SR > 2 的数据为离群值,适用于观察值较少的数据集,而非观察值较多的数据集。 B. 错误。四分位数法定义的离群值范围是 Q1 – 1.5 × IQR 到 Q3 + 1.5 × IQR,而非 Q1 – 2 × IQR 到 Q3 + 2 × IQR。 C. 正确。盖帽法是将连续变量均值上下三倍标准差范围外的记录替换为均值上下三倍标准差值,即盖帽处理。 D. 错误。离群值和错误值在实际操作中很难区分,因为识别这两类问题使用的分析手段是相同的。