CDA LEVEL II 非监督学习考察-CDA考试官方模拟题库

备考刷题，请到

CDA认证小程序

请回答下列非监督学习的算法问题：（2）在K-means聚类分析使用的距离是（）

A. 欧式距离

B. 绝对距离

C. Minkowski距离

D. 笛卡尔距离

上一题

下一题

题目解析

题目评论(0)

参见K-均值聚类的具体方法。

正确答案是：A: 欧式距离

专业分析：
K-means聚类是一种常用的非监督学习算法，其目的是将数据集分成K个簇，使得每个簇内的数据点尽可能相似，而不同簇之间的数据点尽可能不同。在K-means聚类算法中，距离度量是一个关键因素，用来衡量数据点之间的相似性。

欧式距离（Euclidean distance）是K-means聚类分析中最常用的距离度量方法。欧式距离计算的是两个点在多维空间中的直线距离，公式如下：

\[ d(p, q) = \sqrt{\sum_{i=1}^{n} (p_i - q_i)^2} \]

其中，\( p \) 和 \( q \) 是两个数据点，\( n \) 是特征的维数，\( p_i \) 和 \( q_i \) 分别是 \( p \) 和 \( q \) 在第 \( i \) 个维度上的坐标。

选择欧式距离的原因包括：
1. 欧式距离具有良好的几何解释，容易理解和计算。
2. 它在许多实际应用中表现良好，尤其是当数据点在空间中均匀分布时。

虽然其他距离度量（如绝对距离、Minkowski距离等）在某些特定情况下也可以使用，但欧式距离是K-means聚类的默认选择和最常用的度量方式。