考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

层次聚类算法是一种基于距离度量的聚类方法,其核心步骤包括初始化、合并最近类、更新距离矩阵及循环直至单一类。已知某数据集中有n个样本,按照层次聚类的步骤,首先将每个样本视为独立的一类,生成n个类。在计算初始类间距离矩阵后,合并距离最近的两个类形成新类。关于后续操作,以下描述正确的是:
A. 合并后需重新计算所有样本两两之间的距离,更新距离矩阵
B. 合并后需计算新类与剩余各类的距离,更新距离矩阵
C. 合并后直接进行下一次合并,无需重新计算类间距离
D. 合并后需减少样本数量,直至仅剩一个样本
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

根据层次聚类的步骤,合并两类后,需计算新类与当前剩余各类之间的距离(如使用最短距离法、最长距离法或平均距离法等),并更新类间距离矩阵(步骤3)。此过程确保后续合并基于最新的类间距离信息。选项A错误,因合并后计算的是类间距离而非所有样本间的距离;选项C和D违背层次聚类需迭代更新距离矩阵直至所有类合并的原则。只有选项B符合教材中“计算新类与当前各类之间的距离”的关键步骤。