考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

下面的交叉验证方法 :i. 有放回的Bootstrap方法ii. 留一个测试样本的交叉验证iii. 5折交叉验证iv. 重复两次的5折教程验证,当样本是1000时,下面执行时间的顺序,正确的是:
A. i > ii > iii > iv
B. ii > iv > iii > i
C. iv > i > ii > iii
D. ii > iii > iv > i
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

Boostrap方法是传统地随机抽样,验证一次的验证方法,只需要训练1次模型,所以时间最少。留一个测试样本的交叉验证,需要n次训练过程(n是样本个数),这里,要训练1000个模型。5折交叉验证需要训练5个模型。重复2次的5折交叉验证,需要训练10个模型。

为了判断这些交叉验证方法在样本数为1000时的执行时间顺序,我们需要先了解每种方法的基本操作以及计算成本:

1. **Bootstrap方法(有放回重采样)**:
- 从1000个样本中有放回地随机抽取样本形成新的样本集,这样的过程重复多次(通常几十到几百次)。
- 计算成本较高,因为每次采样都需要训练模型,重复次数较多。

2. **留一法交叉验证(Leave-One-Out Cross-Validation, LOOCV)**:
- 每次将一个样本作为验证集,其余样本作为训练集,重复1000次。
- 计算成本很高,因为需要训练1000次模型。

3. **5折交叉验证**:
- 将数据分成5份,每次用1份作为验证集,剩余4份作为训练集,重复5次。
- 计算成本相对较低,因为只需要训练5次模型。

4. **重复两次的5折交叉验证**:
- 在5折交叉验证的基础上重复2次,总共需要训练模型10次。
- 比单次5折交叉验证稍高,但仍比留一法和Bootstrap方法低。

**分析执行时间的顺序**:
- **最耗时**的是留一法交叉验证(ii),因为需要训练1000次。
- **其次耗时**的是Bootstrap方法(i),虽然具体次数取决于设置,但通常在几十到几百次之间。
- **接下来耗时**的是重复两次的5折交叉验证(iv),总共需要训练10次。
- **最不耗时**的是普通的5折交叉验证(iii),只需训练5次。

因此,执行时间顺序为:ii > i > iv > iii。

正确答案是:**D: ii > iii > iv > i**。

但根据我们的分析,似乎选项的描述存在问题。应该是:
实际正确顺序:ii > i > iv > iii