考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

关于Kmeans的优缺点正确的是( )(多选)
A. k的选取不好把握
B. 对非凸数据集来说难以收敛
C. 对噪音敏感
D. 肯定能达到全局最优
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

关于K-means 算法的优缺点,以下是正确的分析:

### 正确答案
- A: k的选取不好把握
- C: 对噪音敏感

### 详细分析

| 选项 | 说明 | 分析 |
|------|------|------|
| A: k的选取不好把握 | True | K-means 需要预先设定聚类的数量 \(k\),但选择合适的 \(k\) 值通常是困难的,因为它依赖于数据集的结构。通常需要通过经验、领域知识或使用方法(如肘部法则、轮廓系数)来确定。 |
| B: 对非凸数据集来说难以收敛 | False | K-means 的主要局限在于其对数据形状的假设,它假设簇是凸的、球形的,所以对非凸簇难以有效捕获,但这不意味着难以收敛,收敛性不依赖簇的形状。 |
| C: 对噪音敏感 | True | K-means 对噪音和异常值非常敏感,因为它使用均值来更新簇的中心,异常点可能会极大地影响这些均值的位置。 |
| D: 肯定能达到全局最优 | False | K-means 由于其本质上使用启发式的迭代优化过程,易于陷入局部最优解,特别是当初始中心选择不佳时。因此,不能保证达到全局最优。多次运行、使用不同的初始中心选择算法(如K-means++)可以改善这一点。 |

以上分析表明,A和C是正确选项。K-means 是一种简单且快速的聚类算法,但在选择簇的数量、数据集的形状以及噪音和异常值的处理上存在限制。