KMeans聚类算法常见误区解析-CDA考试官方模拟题库

备考刷题，请到

CDA认证小程序

关于KMeans聚类算法，下面哪种说法是错误的是？

A. KMeans 算法中的 k是一个超参数，需要我们人为输入来确定

B. 簇中所有数据的均值通常被称为这个簇的“质心”（centroids）

C. 直到簇不再发生变化或者达到最大迭代次数，KMeans算法才停止寻找新的质心

D. 质心越多越好

上一题

下一题

题目解析

题目评论(0)

正确答案是：D: 质心越多越好。

### 分析：

- **A: KMeans 算法中的 k是一个超参数，需要我们人为输入来确定**
- 这是正确的。K代表要构建的簇的数量，是一个需要人工设置的超参数。选择合适的k值是KMeans算法的一个关键步骤。

- **B: 簇中所有数据的均值通常被称为这个簇的“质心”（centroids）**
- 这是正确的。在KMeans算法中，每个簇中的数据点的中心点被称为“质心”，质心是通过计算簇中所有数据点的均值来确定的。

- **C: 直到簇不再发生变化或者达到最大迭代次数，KMeans算法才停止寻找新的质心**
- 这是正确的。KMeans算法的迭代过程会在质心不再发生变化（即簇之间的数据点分配不再改变）或者达到了预设的最大迭代次数时停止。

- **D: 质心越多越好**
- 这是错误的。虽然增加质心的数量可能会提高在训练数据上的拟合效果，但过多的质心会导致过拟合，降低模型对新数据的泛化能力。同时，质心数量越多，算法计算复杂度越高，因此质心不是越多越好，应该根据数据的特点和需求合理选择。