考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

关于KMeans聚类算法,下面哪种说法是错误的是( )?
A. KMeans算法中的k是一个超参数,需要我们人为输入来确定
B. 簇中所有数据的均值通常被称为这个簇的“质心”(centroids)
C. 直到簇不再发生变化或者达到最大迭代次数,KMeans算法才停止寻找新的质心
D. 质心越多越好
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

本题考察对KMeans算法的理解。虽然簇的个数K是用户自己预先设定,但是肯定是会有最优值的,并不是表示越多越好,所以选项D表述错误,其他选项表述均正确,因此本题选D。

正确答案是 D: 质心越多越好。

专业分析:
KMeans聚类算法是一种常用的无监督学习算法,用于将数据集分成K个簇。以下是对各个选项的分析:

A: KMeans算法中的k是一个超参数,需要我们人为输入来确定
正确。K值是用户需要预先指定的参数,它表示要将数据分成多少个簇。

B:簇中所有数据的均值通常被称为这个簇的“质心”(centroids)
正确。质心是簇中所有点的均值,是簇的中心点。

C:直到簇不再发生变化或者达到最大迭代次数,KMeans算法才停止寻找新的质心
正确。KMeans算法的终止条件通常是簇不再发生变化(即簇的分配稳定)或者达到预设的最大迭代次数。

D: 质心越多越好
错误。质心的数量(即K值)并不是越多越好。如果K值过大,可能会导致过拟合,模型在训练数据上表现很好,但在新数据上表现不佳;而如果K值过小,可能会导致欠拟合,无法很好地捕捉数据的内在结构。因此,选择合适的K值是非常重要的,通常可以通过交叉验证或肘部法等方法来确定一个较优的K值。