K最近邻方法特点与应用-CDA考试官方模拟题库

备考刷题，请到

CDA认证小程序

下列何者是K最近邻（K-Nearest Neighborhood）方法的特点？（多选）

A. 它以测试数据当作是它的模型

B. 当训练数据量大时，它的执行效能依然很好

C. 它可用来建立分类模型

D. 它可用来建立数字预测模型

上一题

下一题

题目解析

题目评论(0)

K最近邻（K-Nearest Neighbors, KNN）方法是一种常用的机器学习算法，具有以下特点：

- **A: 它以测试数据当作是它的模型**
不完全正确。KNN实际上不构建显式的模型，它是一个惰性学习算法，即在训练阶段不做任何泛化，仅在需要进行预测时才使用训练数据进行计算。

- **B: 当训练数据量大时，它的执行效能依然很好**
错误。当训练数据量大时，KNN的执行效能较差。因为KNN需要计算测试样本与所有训练样本的距离，数据量大时计算会非常耗时。

- **C: 它可用来建立分类模型**
正确。KNN非常适合用于分类任务，根据测试点在特征空间中与训练样本的邻近关系进行分类。

- **D: 它可用来建立数字预测模型**
正确。KNN可以用于回归任务，通过邻近的训练数据点的数值进行平均或者加权平均来预测。

综上所述，正确答案是：**C 和 D**。

### 专业分析

| 特点 | 描述 |
|------|------|
| **惰性学习** | KNN不需要显式的训练过程，对数据依赖性强，使用整个训练集进行预测。 |
| **适用性** | 可用于分类和回归任务。分类时选择最近的k个邻居投票，回归时计算邻居的平均值。 |
| **计算复杂度** | 计算复杂度较高，尤其是在数据量大和特征维度高时，距离计算耗时。 |
| **特点敏感** | 对特征的尺度和异常值敏感，因此通常需要对数据进行预处理，如归一化。 |
| **模型参数** | 主要参数是k值，k的选择决定了模型的偏置和方差，需要调优。 |

KNN算法的优缺点较为明显，因此在选择时需要结合具体应用场景，评估数据量、特征空间以及对实时性要求等因素。