KMeans聚类算法常见误区分析-CDA考试官方模拟题库

备考刷题，请到

CDA认证小程序

关于KMeans聚类算法，下面哪种说法是错误的是？

A. KMeans 算法中的 k是一个超参数，需要我们人为输入来确定

B. 簇中所有数据的均值通常被称为这个簇的“质心”（centroids）

C. 直到簇不再发生变化或者达到最大迭代次数，KMeans算法才停止寻找新的质心

D. 质心越多越好

上一题

下一题

题目解析

题目评论(0)

正确答案是 D: 质心越多越好。

分析如下：

A: KMeans 算法中的 k是一个超参数，需要我们人为输入来确定。
- 这句话是正确的。在KMeans算法中，k表示要分成的簇的数量，这是一个需要用户指定的超参数。

B: 簇中所有数据的均值通常被称为这个簇的“质心”（centroids）。
- 这句话也是正确的。质心是簇中所有数据点的均值，代表了簇的中心点。

C: 直到簇不再发生变化或者达到最大迭代次数，KMeans算法才停止寻找新的质心。
- 这句话也是正确的。KMeans算法的停止条件通常是簇的分配不再变化或者达到预设的最大迭代次数。

D: 质心越多越好。
- 这句话是错误的。质心的数量（即簇的数量）并不是越多越好。过多的质心可能导致过拟合，模型可能会对数据中的噪声进行过度拟合，失去了泛化能力。理想的质心数量应当通过交叉验证等方法来选择，以达到平衡模型复杂度和泛化性能的目的。