考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

请回答下列非监督学习的算法问题:(2)在K-means聚类分析使用的距离是( )
A. 欧式距离
B. 绝对距离
C. Minkowski距离
D. 笛卡尔距离
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

参见K-均值聚类的具体方法。

正确答案是:A: 欧式距离

专业分析:
K-means聚类是一种常用的非监督学习算法,其目的是将数据集分成K个簇,使得每个簇内的数据点尽可能相似,而不同簇之间的数据点尽可能不同。在K-means聚类算法中,距离度量是一个关键因素,用来衡量数据点之间的相似性。

欧式距离(Euclidean distance)是K-means聚类分析中最常用的距离度量方法。欧式距离计算的是两个点在多维空间中的直线距离,公式如下:

\[ d(p, q) = \sqrt{\sum_{i=1}^{n} (p_i - q_i)^2} \]

其中,\( p \) 和 \( q \) 是两个数据点,\( n \) 是特征的维数,\( p_i \) 和 \( q_i \) 分别是 \( p \) 和 \( q \) 在第 \( i \) 个维度上的坐标。

选择欧式距离的原因包括:
1. 欧式距离具有良好的几何解释,容易理解和计算。
2. 它在许多实际应用中表现良好,尤其是当数据点在空间中均匀分布时。

虽然其他距离度量(如绝对距离、Minkowski距离等)在某些特定情况下也可以使用,但欧式距离是K-means聚类的默认选择和最常用的度量方式。