考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

业务系统往往因为系统故障、设备故障、人为失误等原因导致数据中存在异常数据,下列哪一项方法对于发现异常值有帮助(  )
A. 计算均值加减三倍标准差的范围
B. 梯度下降法
C. 相关性分析
D. 计算四分位距
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

考察异常值检测的方法

正确答案是:A 和 D。

专业分析如下:

A. 计算均值加减三倍标准差的范围:这种方法基于正态分布的假设,通常称为“三西格玛法则”。在正态分布中,99.7%的数据会落在均值加减三倍标准差的范围内。因此,超出这个范围的数据可以被视为异常值。这种方法简单且直观,适用于数据接近正态分布的情况。

D. 计算四分位距:四分位距(Interquartile Range, IQR)是数据分布的中间50%的范围。通过计算第一四分位数(Q1)和第三四分位数(Q3),可以确定IQR。通常,定义异常值的方法是:低于Q1 - 1.5 * IQR或高于Q3 + 1.5 * IQR的数据点被视为异常值。这种方法不依赖于数据的分布形状,适用于各种数据分布。

B. 梯度下降法:梯度下降法是一种优化算法,主要用于最小化损失函数,广泛应用于机器学习模型的训练中。它并不是直接用于发现数据中的异常值。

C. 相关性分析:相关性分析用于衡量两个变量之间的线性关系,不能直接用于发现单个变量中的异常值。

因此,A 和 D 是发现异常值的有效方法。