考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

k均值聚类算法(k-means clustering algorithm)是一种迭代求解的聚类分析算法。在k均值聚类算法里,当邻近度函数采用以下哪种距离的时候,合适的质心是簇中各点的中位数?
A. 曼哈顿距离
B. 平方欧几里德距离
C. 余弦距离
D. Bregman散度
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

当K均值的目标函数是曼哈顿距离表示的误差时候,最小化目标函数的质心是中位数。

在k均值聚类算法中,不同的距离度量方式会影响质心的计算方法。这里我们需要找出在使用何种距离度量时,簇的质心是簇中各点的中位数。

A: 曼哈顿距离 (Manhattan Distance)
B: 平方欧几里德距离 (Squared Euclidean Distance)
C: 余弦距离 (Cosine Distance)
D: Bregman散度 (Bregman Divergence)

对于k均值聚类算法:

- 曼哈顿距离(A选项),也称为L1范数,适用于质心是簇中各点的中位数的情况。曼哈顿距离计算的是各维度之间绝对差值的总和。对于这种距离度量,最小化总和绝对偏差的质心就是各维度上的中位数。

- 平方欧几里德距离(B选项)是欧几里德距离的平方,适用于质心是簇中各点的平均值的情况,而不是中位数。

- 余弦距离(C选项)主要用于度量两个向量之间的夹角余弦值,质心计算方式与曼哈顿距离和欧几里德距离不同,更适合于高维空间中向量的方向相似性。

- Bregman散度(D选项)是一类广义的距离度量,包含了许多具体的距离函数。其质心计算方式依赖于具体的Bregman散度形式,但通常情况下也不是中位数。

综合以上分析,正确答案是:

A: 曼哈顿距离

在使用曼哈顿距离作为邻近度函数时,合适的质心是簇中各点的中位数。