考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

聚类方法中哪种方法计算两个类(两椭球)之间的距离较少受到异常值的影响?
A. 平均联接
B. 重心法
C. Ward最小方差法
D. B和C
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

正确答案是:B: 重心法

### 专业分析:

在聚类分析中,不同的方法对噪声和异常值的敏感程度不同。

- **平均联接法(Average Linkage)**:
- 计算方式:使用类中所有点之间的平均距离来衡量类间距离。
- 异常值敏感性:相对较高,因为异常值会影响平均距离的计算,从而导致不稳定的聚类结果。

- **重心法(Centroid Method)**:
- 计算方式:通过计算两个类的重心(即质心)之间的距离来度量类间距离。
- 异常值敏感性:相对较低。尽管异常值会影响质心的位置,但对整体质心的偏移较小,因此更稳定。

- **Ward最小方差法(Ward's Minimum Variance Method)**:
- 计算方式:通过最小化类内平方和来进行聚类。选择合并后的类内方差最小的两个类。
- 异常值敏感性:对异常值有一定的敏感性,因为方差计算会受到异常值的显著影响。

### 结论:
重心法由于直接使用质心来计算类间距离,较少受到异常值的影响,因此是更为稳健的选择。Ward法会受到异常值影响,因为方差是敏感的统计量。平均联接法也会因为使用平均值而受到异常值的影响。

因此,选项B是正确的。