新用户注册
备考刷题,请到
CDA认证小程序
题目中提到分类变量含有“稀有水平”(出现次数少的类别)和“错误值”(未知_测试),这属于“单变量数据问题”中的分类变量问题。对应的预处理步骤是“分类变量概化处理”(如合并稀有类别、修正错误值)。