考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

在解释层次聚类的结果时,树状图(Dendrogram)是一个关键的可视化工具。图中纵轴的高度代表了簇在合并时的一个度量。一个常用的确定最佳簇数K的启发式方法是:寻找可以被水平线切割的最长的垂直线。这条最长的垂直线所代表的含义是?
A. 这是两个最大的簇在进行合并。
B. 这次合并涉及到的数据点数量最多。
C. 这次合并使得簇内方差的增加量最大(仅适用于Ward方法)。
D. 这次合并是在所有合并步骤中,将两个最不相似(距离最远)的簇连接在了一起。
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

树状图的纵轴高度代表了每次合并时,被合并的两个簇之间的距离或不相似度。一条垂直线的高度,就等于其连接的两个子簇在合并时的距离。因此,最长的垂直线意味着,在那个特定的合并步骤中,算法被迫将两个在当时“最不相似”(距离最远)的簇合并在一起。这个巨大的“跳跃”表明,这两个簇在本质上可能非常不同,因此,一个好的切割点就在这次合并之前,即切割这条最长的垂直线。A和B不正确,合并的大小或数据点数量不直接由高度表示。C选项的描述仅特定于Ward方法的目标函数,但更通用的解释是D。