数据分析师必知的交叉验证常见误区-CDA考试官方模拟题库

备考刷题，请到

CDA认证小程序

PYTHON中cross_val_score类是实现交叉验证的语法，以下说法错误的是（）（多选）

A. 交叉验证的运行时间并不多，因此可以用于超大型数据分析中；

B. cross_val_score可以用于分层、留一法、分组法等验证；

C. 交叉验证的作用只能用于判断数据是否过拟合；

D. cross_val_score可以用于召回率和f1的验证；

上一题

下一题

题目解析

题目评论(0)

在分析这些选项之前，我们需要了解 `cross_val_score` 的作用和用法。`cross_val_score` 是 Scikit-learn 库中的一个函数，用于对模型进行交叉验证。它可以评估模型的性能并帮助选择最佳模型参数。现在，让我们逐一分析每个选项：

A: 交叉验证的运行时间并不多，因此可以用于超大型数据分析中。
- 错误。交叉验证的运行时间与数据集的大小和模型的复杂性密切相关。对于超大型数据集，交叉验证可能会非常耗时，因为它需要多次训练模型（每次训练都使用不同的训练/验证拆分）。

B: cross_val_score可以用于分层、留一法、分组法等验证。
- 正确。`cross_val_score` 可以通过设置 `cv` 参数实现多种交叉验证策略，包括分层交叉验证（StratifiedKFold）、留一法（LeaveOneOut）、分组交叉验证（GroupKFold）等。

C: 交叉验证的作用只能用于判断数据是否过拟合。
- 错误。交叉验证的作用不仅限于判断过拟合，还可以用于评估模型的整体性能、选择最佳模型参数、比较不同模型等。

D: cross_val_score可以用于召回率和f1的验证。
- 正确。`cross_val_score` 可以通过设置 `scoring` 参数来评估不同的指标，包括召回率（recall）和 F1 分数（f1）。

综上所述，错误的选项是 A 和 C。