考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

K-Means算法是无监督的聚类算法,它实现起来比较简单,聚类效果也不错,因此应用很广泛。下列有关K-means算法的叙述何者有误?
A. 运行速度较一些聚类方法(例如,PAM)慢
B. 离群值将影响聚类的结果
C. 起始群中心的选择将影响聚类的结果
D. 能接受类别型的字段
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

Kmeans无法接受类别字段,运行速度不一定慢

正确答案是:A: 运行速度较一些聚类方法(例如,PAM)慢

### 分析:

1. **A: 运行速度较一些聚类方法(例如,PAM)慢**
- 这是错误的。K-Means算法的运行速度通常较快,特别是在处理大规模数据集时。相比之下,PAM(Partitioning Around Medoids)通常需要更多的计算时间,因为它需要计算所有数据点与每个中心点的距离。

2. **B: 离群值将影响聚类的结果**
- 这是正确的。K-Means对离群值比较敏感,因为离群值会影响簇中心的计算,从而影响最终的聚类结果。

3. **C: 起始群中心的选择将影响聚类的结果**
- 这是正确的。K-Means算法对初始中心点的选择敏感,不同的初始化可能导致不同的聚类结果。为了减少这种影响,通常会运行多次K-Means算法并选择最优结果,或者使用K-Means++等改进方法来选择初始中心。

4. **D: 能接受类别型的字段**
- 这是错误的。K-Means算法适用于数值型数据,不适用于类别型数据。类别型数据需要进行适当的编码(如独热编码)才能用于K-Means算法。

因此,A选项的叙述是有误的。