数据分析师考试：missForest方法常见误区-CDA考试官方模拟题库

备考刷题，请到

CDA认证小程序

在缺失值处理时，我们可以使用均值填补、中位数填补、missForest方法填补等，关于missForest方法，下面错误的是（）。

A. 这是利用随机森林来填补缺失值的方法

B. 此方法可以适用于任何类型的数据(连续、离散)

C. 即使数据量比较大的情况，这个方法也比其他方法速度快

D. 这方法虽然效果比较好，但是相比其他方法，效率就太低了

上一题

下一题

题目解析

题目评论(0)

在给定的选项中，错误的是选项 C：

C: 即使数据量比较大的情况，这个方法也比其他方法速度快。

### 分析：

missForest 是一种基于随机森林的缺失值填补方法，以下是对各个选项的分析：

- **A: 这是利用随机森林来填补缺失值的方法**
- 正确。missForest 是通过随机森林来预测和填补数据中的缺失值。

- **B: 此方法可以适用于任何类型的数据(连续、离散)**
- 正确。missForest 能够处理连续型和离散型数据，其灵活性使它适用于各种数据类型。

- **C: 即使数据量比较大的情况，这个方法也比其他方法速度快**
- 错误。在数据量较大的情况下，missForest 的计算复杂度较高，因为随机森林本身的训练代价较大，所以在大数据量场景下，其速度往往慢于一些简单的方法（如均值或中位数填补）。

- **D: 这方法虽然效果比较好，但是相比其他方法，效率就太低了**
- 正确。与简单的填补方法（如均值、中位数填补）相比，missForest 的计算需求较大，尽管填补效果通常更好，但效率确实较低。

因此，选项 C 的描述是错误的。missForest 在处理大数据集时速度较慢，与此同时，其他更简单的方法可能会更快。