新用户注册
备考刷题,请到
CDA认证小程序
本题考查处理缺失值相关知识。对于占比10%左右的数据集缺失值处理,可以采用均值填补、K-means聚类填补和回归填补等方式,众数填补一般是对每一列的缺失值,填充当列的众数。由于存在某列缺失值过多,众数为NAN的情况,因此这里取的是每列删除掉NAN值后的众数,因此不合适此类场景,可以尝试改为用中位数填补。因此本题正确的选项是ABC。