考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

有关python语法说法正确的是()
A. train_test_split类只能设置训练集合的样本数;
B. train_test_split类只能设置测试集合的样本数;
C. train_test_split类可以分层,然后分区;
D. train_test_split类可以直接分出验证集合;
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

在分析这个问题之前,我们需要明确 `train_test_split` 是来自于 Scikit-learn 库中的一个函数,而不是一个类。这个函数用于将数据集划分为训练集和测试集。

A: "train_test_split类只能设置训练集合的样本数"
这个说法不正确。`train_test_split` 允许通过 `train_size` 参数设置训练集的大小,但这不是它的唯一功能。

B: "train_test_split类只能设置测试集合的样本数"
这个说法也不完全正确。`train_test_split` 确实可以通过 `test_size` 参数设置测试集的大小,但它不仅限于此。

C: "train_test_split类可以分层,然后分区"
这个说法是正确的。`train_test_split` 函数提供了 `stratify` 参数,允许用户在分割数据集时进行分层采样。这在处理分类问题时非常有用,可以确保训练集和测试集中各类别的比例与原始数据集相同。

D: "train_test_split类可以直接分出验证集合"
这个说法不正确。`train_test_split` 只能直接分割出训练集和测试集。如果需要验证集,通常的做法是先用 `train_test_split` 分割出训练集和测试集,然后再对训练集使用 `train_test_split` 进一步分割出验证集。

因此,正确答案是 C。