考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

对于KNN来说,它的缺点是什么?(多选)
A. 计算效率低
B. 需要去量纲
C. 对异常值敏感
D. 应用少
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

对于KNN(K-Nearest Neighbors,K最近邻)算法,以下是其主要缺点的分析:

- **A: 计算效率低**
- **正确**。KNN算法在预测阶段需要计算待预测样本与所有训练数据的距离,这在数据量很大时会带来较高的计算开销,因此其计算效率较低。

- **B: 需要去量纲**
- **正确**。KNN算法基于距离来判断邻近程度,因此各特征之间尺度的不同会对结果产生很大影响。为提高模型性能,通常需要对数据进行标准化或归一化处理(去量纲)。

- **C: 对异常值敏感**
- **正确**。由于KNN直接使用训练数据中的实例来进行分类或回归,异常值(outliers)会直接影响其结果,可能会导致误分类。

- **D: 应用少**
- **错误**。KNN是一种基础且广泛应用的算法,适用于分类、回归以及数据降维等多种任务,尤其在低维数据的小规模数据集上表现良好。

### 专业分析

KNN算法的优点包括简单易懂和不需要明确的训练过程,然而,其缺点主要在于:

1. **高计算成本**:需要计算每个未标记样本与所有已标记样本之间的距离,对于大数据集效率很低。
2. **存储要求高**:必须保留所有训练数据用于预测阶段,存储需求大。
3. **对特征缩放敏感**:特征值规模差异会影响距离计算,导致KNN对特征缩放非常敏感。
4. **对噪声和异常值敏感**:异常值会影响邻近数据点的分类。
5. **维数灾难**:在高维空间中,距离度量可能失效,这会导致KNN性能下降。

这些缺点使得KNN在某些应用场景中需要结合特征选择、数据预处理和适当的距离度量来改进其效果。