K-Means聚类算法常见问题解答-CDA考试官方模拟题库

备考刷题，请到

CDA认证小程序

下列关于K-Means聚类算法说法正确的有（）。（多选）

A. 对聚类中心的初始化比较敏感，不同的初始化带来不同的聚类结果。

B. K值需要首先人工确定(启发式)。

C. 聚类擅长处理聚类各簇服从标准正态分布的数据。

D. K-Means 对于噪声比较敏感。

上一题

下一题

题目解析

题目评论(0)

考点：考核KMeans算法的基本特性

关于K-Means聚类算法，以下说法是正确的：

A: 对聚类中心的初始化比较敏感，不同的初始化带来不同的聚类结果。

B: K值需要首先人工确定(启发式)。

D: K-Means 对于噪声比较敏感。

### 专业分析：

- **A: 聚类中心的初始化敏感性**
- K-Means算法对初始聚类中心的选择非常敏感。不同的初始化可能导致算法收敛到不同的局部最优解，使得聚类结果有所不同。这是因为K-Means使用迭代优化的方法，而初始值的选择会影响整个迭代过程的走向。

- **B: K值的人工确定**
- 在使用K-Means算法前，必须先确定聚类的数量K。通常，这个值是通过经验、领域知识或者通过启发式的方法（如肘部法则）来确定的。没有一个自动的方法可以准确地确定K的最佳值。

- **C: 聚类服从标准正态分布的数据**
- 该说法不完全正确。K-Means假设簇是凸的且大致球状的，它通过最小化点到簇中心的平方距离进行聚类。虽然K-Means可以处理一些类似正态分布的数据，但并不要求数据严格服从正态分布。对于非球状和异质的数据，K-Means往往表现不好。

- **D: 对噪声的敏感性**
- K-Means对噪声和异常值非常敏感。这是因为这些异常值可能极大地影响质心的计算，从而导致聚类结果的不稳定。因此，在应用K-Means时，通常需要对数据进行预处理，去除噪声和异常值。

综上所述，选项A、B和D是正确的。