考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

对于原始Kmeans的缺陷来说,以下正确的是( )(多选)
A. Kmeans的一大缺陷是初始点是随机的
B. 初始点的不同可能导致最后结果的不同
C. 初始点太过于极端,可能会导致某些初始点丢失
D. Kmeans需要做归一化或者标准化
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

K-Means算法是一种常用的聚类算法,但其原始版本确实存在一些缺陷。根据你的问题,以下是对选项的分析:

- **A: Kmeans的一大缺陷是初始点是随机的**
- **正确**。K-Means算法的初始中心点是随机选择的,这可能导致不同的运行结果,特别是如果数据集有多个局部极小值。

- **B: 初始点的不同可能导致最后结果的不同**
- **正确**。由于初始中心的随机选择性,可能导致不同的聚类结果,即算法可能会收敛到不同的局部极小值。

- **C: 初始点太过于极端,可能会导致某些初始点丢失**
- **不完全正确**。初始点极端可能导致聚类效果不佳,但这不会导致初始点“丢失”。而是可能导致收敛缓慢或者聚类不理想。

- **D: Kmeans需要做归一化或者标准化**
- **正确**。K-Means使用欧氏距离计算样本间的相似性,因此单个特征尺度过大可能会影响聚类效果。对数据进行归一化或标准化有助于减轻某些特征对结果的不当影响。

基于以上分析,正确答案为:A, B, D。