考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

在进行数据分析时,经常要分割训练集、测试集,并且还要考虑数据预处理、特征加工,那么要仔细分析这些步骤之间的相互联系。关于训练集、测试集、数据预处理、特征工程,请回答以下问题 (1)关于缺失值填充与训练集、测试集的关系,下面正确的操作是()
A. 先用全数据的均值填充缺失值,然后随机分割训练集、测试集
B. 先随机分割训练集、测试集,然后用各自集合的均值填充缺失值
C. 先随机分割训练集、测试集,然后用训练集的均值填充缺失值
D. 先随机分割训练集、测试集,然后用测试集的均值填充缺失值
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

我们的模型是基于训练集的数据建立的,测试集是用来测试训练的模型好坏与 否,是不应该被碰触引入任何其他数据信息的数据。A选项的错误在于用全数据的均值填充 缺失值。B和D选项的错误都在于不可以用测试集的均值来填充测试集的缺失值。