KNN算法的常见缺点有哪些-CDA考试官方模拟题库

备考刷题，请到

CDA认证小程序

对于KNN来说，它的缺点是什么？（多选）

A. 计算效率低

B. 需要去量纲

C. 对异常值敏感

D. 应用少

上一题

下一题

题目解析

题目评论(0)

对于KNN（K-Nearest Neighbors，K最近邻）算法，以下是其主要缺点的分析：

- **A: 计算效率低**
- **正确**。KNN算法在预测阶段需要计算待预测样本与所有训练数据的距离，这在数据量很大时会带来较高的计算开销，因此其计算效率较低。

- **B: 需要去量纲**
- **正确**。KNN算法基于距离来判断邻近程度，因此各特征之间尺度的不同会对结果产生很大影响。为提高模型性能，通常需要对数据进行标准化或归一化处理（去量纲）。

- **C: 对异常值敏感**
- **正确**。由于KNN直接使用训练数据中的实例来进行分类或回归，异常值（outliers）会直接影响其结果，可能会导致误分类。

- **D: 应用少**
- **错误**。KNN是一种基础且广泛应用的算法，适用于分类、回归以及数据降维等多种任务，尤其在低维数据的小规模数据集上表现良好。

### 专业分析

KNN算法的优点包括简单易懂和不需要明确的训练过程，然而，其缺点主要在于：

1. **高计算成本**：需要计算每个未标记样本与所有已标记样本之间的距离，对于大数据集效率很低。
2. **存储要求高**：必须保留所有训练数据用于预测阶段，存储需求大。
3. **对特征缩放敏感**：特征值规模差异会影响距离计算，导致KNN对特征缩放非常敏感。
4. **对噪声和异常值敏感**：异常值会影响邻近数据点的分类。
5. **维数灾难**：在高维空间中，距离度量可能失效，这会导致KNN性能下降。

这些缺点使得KNN在某些应用场景中需要结合特征选择、数据预处理和适当的距离度量来改进其效果。