考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

K-Means算法是无监督的聚类算法,它实现起来比较简单,聚类效果也不错,因此应用很广泛。下列有关K-means算法的叙述何者有误?
A. 运行速度较一些聚类方法(例如,PAM)慢
B. 离群值将影响聚类的结果
C. 起始群中心的选择将影响聚类的结果
D. 能接受类别型的字段
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

正确答案是:A: 运行速度较一些聚类方法(例如,PAM)慢

**专业分析:**

K-Means算法是一种经典的无监督聚类算法,其主要特点和影响因素如下:

1. **运行速度:**
K-Means算法的运行速度相对较快,特别是对于大规模数据集。它的时间复杂度通常为O(nkt),其中n是数据点的数量,k是簇的数量,t是迭代次数。相比之下,PAM(Partitioning Around Medoids)算法的时间复杂度较高,为O(n^2kt),因此K-Means在大多数情况下运行速度更快。

2. **离群值:**
K-Means算法对离群值比较敏感,因为离群值会影响簇中心的计算,进而影响聚类结果。

3. **起始群中心的选择:**
K-Means算法的结果受初始群中心选择的影响很大。不同的初始群中心可能导致不同的聚类结果,因此常常需要多次运行K-Means算法,并选择最优的结果。

4. **数据类型:**
K-Means算法通常用于数值型数据,因为它基于欧氏距离计算。对于类别型数据,K-Means并不适用。类别型数据可以使用K-modes或者其他适合类别型数据的聚类算法。

综上所述,选项A是错误的,因为K-Means算法的运行速度相对较快。其他选项B、C和D的描述都是正确的。