考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

常见的缺失值填充方法有填充默认值、均值、众数等方式。下面可以对分类变量的缺失值填充的方法是?
A. 均值
B. 中位数
C. 众数
D. 最小值
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

除了众数,其他统计值在分类变量中不存在

对于分类变量的缺失值填充,通常使用的是众数。分类变量是指那些取值为类别或标签的变量,而不是数值型变量。均值和中位数是数值型变量的统计量,不适用于分类变量。众数是指数据集中出现频率最高的值,适用于分类变量的缺失值填充。

因此,正确答案是:C: 众数。

专业分析:
- **均值**:适用于数值型变量,计算所有数值的平均值。
- **中位数**:适用于数值型变量,表示数据的中间值。
- **众数**:适用于分类变量和数值型变量,表示数据中出现频率最高的值。
- **最小值**:适用于数值型变量,表示数据中的最小值,不适用于分类变量。

在处理分类变量时,众数填充是最常用的方法,因为它能代表数据集中最常见的类别,从而保持数据的一致性和代表性。