在基本K均值算法中,不同的邻近度函数会影响质心的计算方式:
A. **曼哈顿距离**:
- 曼哈顿距离又称为L1距离,它是坐标对应点数值差值的绝对值之和。
- 当使用曼哈顿距离时,合适的质心是簇中各点的中位数,而不是平均值。其原因在于中位数能最小化绝对误差。
B. **平方欧几里德距离**:
- 这是最常用的距离度量方法,它是常规欧几里德距离的平方。
- 使用平方欧几里德距离时,合适的质心是簇中各点的平均值,因为平均值最小化了平方误差。
C. **余弦距离**:
- 这种度量方式关注的是两个向量间的夹角,而非其大小。
- 余弦距离不适合于传统的质心定义,因为它不直接依赖于点的加权平均或中位数。
D. **Bregman散度**:
- Bregman散度是广义上的距离度量,用于更复杂的数据分布。
- 它处理的情形与标准的均值和中位数概念有所不同。
综上所述,合适的答案是 **A: 曼哈顿距离**。当使用曼哈顿距离作为邻近度函数时,簇中各点的中位数作为质心是合适的,因为中位数最小化了曼哈顿距离下的误差。