考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

下列哪些选项是K-Means聚类的缺点?(多选)
A. 对聚类中心的初始化比较敏感,不同的初始化带来不同的聚类结果。
B. K 值需要首先人工确定(启发式)。
C. 只能处理服从标准正态分布的聚类。
D. K-Means 对于噪声比较敏感。
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

K-Means 聚类算法确实存在一些缺点。以下是对每个选项的分析:

- **A: 对聚类中心的初始化比较敏感,不同的初始化带来不同的聚类结果。**
**正确**。K-Means 对初始聚类中心的选择非常敏感,不同的初始化可能导致不同的聚类结果,甚至导致收敛到不同的局部最小值。因此,通常需要使用多次运行 K-Means 或者使用优化的初始化方法(例如 K-Means++)来改善结果的稳定性。

- **B: K 值需要首先人工确定(启发式)。**
**正确**。K-Means 需要事先指定聚类的数目 K,这通常是通过经验、启发式方法或先验知识来决定的。这对于实际应用可能是一个缺点,因为错误的 K 值选择可能导致不理想的聚类结果。

- **C: 只能处理服从标准正态分布的聚类。**
**错误**。K-Means 并不局限于处理标准正态分布数据,但它假设聚类具有相似的形状和大小、球状分布,且各聚类的方差相似。即便如此,K-Means 并不严格要求数据服从标准正态分布。

- **D: K-Means 对于噪声比较敏感。**
**正确**。K-Means 对于异常点或噪声数据比较敏感,因为这些异常点会显著影响均值的位置,从而影响聚类结果。对噪声的敏感性会导致聚类中心偏移,聚类精度下降。

综上所述,K-Means 聚类的缺点包括:
- 对聚类中心的初始化比较敏感(选项A)
- K 值需要首先人工确定(选项B)
- 对于噪声比较敏感(选项D)

因此,选项 A、B 和 D 均为正确答案。