当K均值的目标函数是曼哈顿距离表示的误差时候,最小化目标函数的质心是中位数。
在k均值聚类算法中,不同的距离度量方式会影响质心的计算方式。对于题目中提到的几种距离度量方式:
A: 曼哈顿距离(Manhattan Distance)
B: 平方欧几里德距离(Squared Euclidean Distance)
C: 余弦距离(Cosine Distance)
D: Bregman散度(Bregman Divergence)
其中,当使用曼哈顿距离(Manhattan Distance)作为邻近度函数时,合适的质心是簇中各点的中位数。这是因为曼哈顿距离度量的是绝对值之和,使用中位数可以最小化绝对偏差的和。
具体分析如下:
1. **曼哈顿距离(Manhattan Distance)**:
- 曼哈顿距离是各个维度上绝对差值的和。
- 当使用曼哈顿距离时,最佳的质心应该是使得到簇中各点的曼哈顿距离总和最小的点。
- 这种情况下,质心应为各个维度上数据点的中位数,因为中位数可以最小化绝对偏差的和。
2. **平方欧几里德距离(Squared Euclidean Distance)**:
- 平方欧几里德距离是欧几里德距离的平方。
- 当使用平方欧几里德距离时,最佳的质心是簇中各点的均值,因为均值可以最小化平方误差的和。
3. **余弦距离(Cosine Distance)**:
- 余弦距离度量的是两个向量之间的夹角。
- 余弦距离不适合用k均值聚类算法中的质心表示,因为它关注的是方向而不是具体的数值位置。
4. **Bregman散度(Bregman Divergence)**:
- Bregman散度是一类广义的距离度量。
- 使用Bregman散度时,质心通常是使得Bregman散度总和最小的点。具体计算方式依赖于所使用的具体Bregman散度形式。
综上所述,正确答案是:
A: 曼哈顿距离(Manhattan Distance)
因此,当邻近度函数采用曼哈顿距离时,合适的质心是簇中各点的中位数。