考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

缺失值从缺失的分布来讲可以分为完全随机缺失,随机缺失和完全非随机缺失。随机缺失指的是
A. 缺失数据与该变量的真实值无关,与其他变量的数值也无关。
B. 缺失数据与其他变量有关
C. 缺失数据依赖于该变量本身
D. 数据集中不含缺失值
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

随机缺失指的是数据的缺失依赖于其他观测变量。比如时间梯度越长的采集越可能有缺失值的出现。这个时候,若是我们将时间变量进行控制,那么数据的缺失也就变成了完全随机的了

正确答案是 B: 缺失数据与其他变量有关。

**专业分析:**

缺失值可以从缺失的分布来讲分为三种类型:完全随机缺失(MCAR)、随机缺失(MAR)和完全非随机缺失(MNAR)。

1. **完全随机缺失(MCAR)**:
- 定义:缺失数据与该变量的真实值无关,也与其他变量的数值无关。
- 解释:即数据缺失是完全随机发生的,缺失的概率与任何已知或未知的变量都没有关系。
- 选项对应:A

2. **随机缺失(MAR)**:
- 定义:缺失数据与该变量的真实值无关,但与其他变量的数值有关。
- 解释:即数据缺失的概率与缺失值本身无关,但与其他观测到的变量有关系。
- 选项对应:B

3. **完全非随机缺失(MNAR)**:
- 定义:缺失数据依赖于该变量本身。
- 解释:即数据缺失的概率与缺失值本身有关,缺失的值本身会影响缺失的发生。
- 选项对应:C

选项D表示数据集中不含缺失值,这不属于缺失数据的类型范畴。

因此,随机缺失(MAR)指的是缺失数据与其他变量有关,对应选项B。