考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

下列关于K-Means聚类算法说法正确的有( )。(多选)
A. 对聚类中心的初始化比较敏感,不同的初始化带来不同的聚类结果。
B. K值需要首先人工确定(启发式)。
C. 聚类擅长处理聚类各簇服从标准正态分布的数据。
D. K-Means 对于噪声比较敏感。
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

考点:考核KMeans算法的基本特性

关于K-Means聚类算法,以下说法是正确的:

A: 对聚类中心的初始化比较敏感,不同的初始化带来不同的聚类结果。

B: K值需要首先人工确定(启发式)。

D: K-Means 对于噪声比较敏感。

### 专业分析:

- **A: 聚类中心的初始化敏感性**
- K-Means算法对初始聚类中心的选择非常敏感。不同的初始化可能导致算法收敛到不同的局部最优解,使得聚类结果有所不同。这是因为K-Means使用迭代优化的方法,而初始值的选择会影响整个迭代过程的走向。

- **B: K值的人工确定**
- 在使用K-Means算法前,必须先确定聚类的数量K。通常,这个值是通过经验、领域知识或者通过启发式的方法(如肘部法则)来确定的。没有一个自动的方法可以准确地确定K的最佳值。

- **C: 聚类服从标准正态分布的数据**
- 该说法不完全正确。K-Means假设簇是凸的且大致球状的,它通过最小化点到簇中心的平方距离进行聚类。虽然K-Means可以处理一些类似正态分布的数据,但并不要求数据严格服从正态分布。对于非球状和异质的数据,K-Means往往表现不好。

- **D: 对噪声的敏感性**
- K-Means对噪声和异常值非常敏感。这是因为这些异常值可能极大地影响质心的计算,从而导致聚类结果的不稳定。因此,在应用K-Means时,通常需要对数据进行预处理,去除噪声和异常值。

综上所述,选项A、B和D是正确的。