考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

对于KNN算法来说,缺点是什么?(多选)
A. 计算效率低,消耗的计算资源较大
B. 对异常值敏感
C. 可重复性弱
D. 需要做归一化处理
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

对于KNN(K最近邻)算法,其缺点可以总结为以下几个选项:

- **A: 计算效率低,消耗的计算资源较大**
这是正确的。KNN算法在预测阶段需要对每一个测试数据点计算其与所有训练数据点的距离。因此,计算成本较高,尤其是在数据集较大时,效率低下且消耗大量计算资源。

- **B: 对异常值敏感**
这也是正确的。KNN对异常值敏感,因为异常值会直接影响距离的计算,从而影响预测结果。

- **C: 可重复性弱**
这一点并不是KNN的典型缺点。KNN算法的可重复性通常是稳定的,只要使用相同的训练数据集和参数设置,其结果应当是可重复的。

- **D: 需要做归一化处理**
这是正确的。KNN对特征的量纲非常敏感,因此在使用KNN之前,通常需要对数据进行归一化处理,以确保不同特征对距离计算的贡献一致。

总结来看,选项 A、B 和 D 是KNN算法的主要缺点。选项 C 并不是其常见的问题。以下是对这些缺点的分析:

| 缺点 | 分析 |
|--------------------------|----------------------------------------------------------------------|
| 计算效率低 | 由于需要计算每一个测试样本到所有训练样本的距离,故在大数据集下效率低。|
| 对异常值敏感 | 异常值会影响距离计算,导致预测结果偏差。 |
| 需要做归一化处理 | 特征值大小不同会影响距离计算,需要预处理以改善效果。 |