考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

请回答下列非监督学习的算法问题(2)在K-means聚类分析使用的距离是( )
A. 欧式距离
B. 绝对距离
C. Minkowski距离
D. 笛卡尔距离
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

参见K-均值聚类的具体方法

在K-means聚类分析中,常用的距离度量是欧式距离。因此,正确答案是A: 欧式距离。

### 专业分析:
K-means 聚类算法的目标是将数据集分成K个簇,使得每个簇内的数据点与该簇的中心(质心)之间的距离之和最小。为了实现这一目标,K-means 主要依赖于以下步骤:

1. **选择初始质心**:随机选择K个点作为初始质心。
2. **分配数据点**:将每个数据点分配到最近的质心,形成K个簇。
3. **更新质心**:计算每个簇的质心,即簇内所有点的平均值。
4. **重复步骤2和3**,直到质心不再发生显著变化或达到指定的迭代次数。

在步骤2中,为了确定每个数据点到各个质心的距离,K-means 通常使用欧式距离公式:

\[ d(x_i, \mu_j) = \sqrt{\sum_{k=1}^{n} (x_{ik} - \mu_{jk})^2} \]

其中,\( x_i \) 是数据点,\( \mu_j \) 是质心,n 是特征的维数。

欧式距离的选择是因为其计算简单且在大多数情况下能够有效地反映数据点之间的相似性。然而,在某些特定应用中,也可以使用其他距离度量,如绝对距离(曼哈顿距离)或Minkowski距离,但这些不是K-means算法的默认选择。

因此,标准K-means聚类分析使用的距离是欧式距离。