考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

下列关于层次聚类描述不正确的是()
A. 层次聚类通常分为自底向上和自顶向下
B. 层次聚类的优点是可以得到不同粒度上的多层次聚类结构
C. 层次聚类的计算量大,对异常值十分敏感
D. 层次聚类需要预先指定聚类数
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

正确答案是 D: 层次聚类需要预先指定聚类数。

### 专业分析:

1. **自底向上和自顶向下**:
- **A 选项正确**:层次聚类确实有两种主要的方法:
- **自底向上(凝聚式)**:从每个数据点作为单独的一个簇开始,逐步合并最近的簇。
- **自顶向下(分裂式)**:从所有数据点作为一个簇开始,逐步将最不相似的簇分裂。

2. **多层次聚类结构**:
- **B 选项正确**:层次聚类的一个重要优点是其能够产生一个树状的层次结构(称为树状图或 dendrogram),使得我们可以在不同的层次上观察聚类结果,得到不同粒度的聚类。

3. **计算量和异常值**:
- **C 选项正确**:层次聚类的计算复杂度较高,因为其需要计算和更新距离矩阵,尤其是对于大型数据集。且层次聚类方法是对噪声和异常值敏感的,因为一旦合并或分裂进行后,不能像其他聚类方法(如 K-means)那样通过反复迭代进行修正。

4. **预先指定聚类数**:
- **D 选项不正确**:层次聚类不需要预先指定聚类数。相反,它通过构建树状图来显示数据的聚类结构。我们可以通过选择树状图的不同水平来决定最终的聚类数量。这是它的一个优势,相较于 K-means 等方法,它无需提前确定聚类的数目。