考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

对于K-Means算法,描述错误的是( )?
A. 该算法与样本数量线性相关,所以适合大数据集
B. 需要事先确定K值
C. 对异常值不敏感
D. 算法效率较高,伸缩性较好
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

本题考察对K-Means算法的理解。K-Means算法对异常值敏感,通常需要删除异常值或进行变量转换处理,因此选项C表述错误,其余选项均正确,因此本题选C。

正确答案是:C: 对异常值不敏感

专业分析:

A: 该算法与样本数量线性相关,所以适合大数据集。
这个描述是正确的。K-Means算法的时间复杂度为O(n*k*i),其中n是样本数量,k是簇的数量,i是迭代次数。由于时间复杂度与样本数量线性相关,因此在合理参数设置下,K-Means算法适用于大数据集。

B: 需要事先确定K值。
这个描述也是正确的。K-Means算法需要在开始时指定簇的数量K,这是算法的一个前提条件。

C: 对异常值不敏感。
这个描述是错误的。K-Means算法对异常值(outliers)比较敏感,因为异常值可能会显著影响簇中心(centroids)的计算,导致簇的分配不准确。

D: 算法效率较高,伸缩性较好。
这个描述是正确的。K-Means算法相对简单,计算效率较高,并且能够较好地扩展到大数据集。

综上所述,描述错误的是C选项,即“对异常值不敏感”。