层次聚类适用场景及误区分析-CDA考试官方模拟题库

备考刷题，请到

CDA认证小程序

以下关于层次聚类的描述中，错误的是（）

A. 层次聚类也叫作系统聚类

B. 层次聚类法通常分为自底向上和自顶向下

C. 层次聚类的过程非常清楚，会形成类似树状的聚类图谱，便于理解和检查

D. 层次聚类适用于数据量非常大或者变量非常多的项目

上一题

下一题

题目解析

题目评论(0)

层次聚类由于需要反复计算距离，限制了层次聚类的速度。因此不适用于数据量非常大或者变量非常多的项目。

在层次聚类的描述中，错误的选项是 D: 层次聚类适用于数据量非常大或者变量非常多的项目。

### 分析：

1. **A: 层次聚类也叫作系统聚类**
- 这种说法是正确的。层次聚类（Hierarchical Clustering）确实也被称为系统聚类，因为它以层次的方式构建聚类，形成一个树状结构。

2. **B: 层次聚类法通常分为自底向上和自顶向下**
- 这也是正确的。层次聚类有两种主要方法：
- 自底向上（凝聚的）：从每个数据点开始，不断将最近的两个聚类合并。
- 自顶向下（分裂的）：从所有数据组成一个大聚类开始，不断将其分裂成更小的子聚类。

3. **C: 层次聚类的过程非常清楚，会形成类似树状的聚类图谱，便于理解和检查**
- 正确。层次聚类的结果可以表示为树状图（树状图也被称为树状图表或树状图谱），这使得聚类过程透明并且便于理解和分析。

4. **D: 层次聚类适用于数据量非常大或者变量非常多的项目**
- 错误。层次聚类的计算复杂度较高，随着数据量和变量的增加，其计算成本和内存需求会显著增加。因此，层次聚类通常不适用于非常大数据集或具有大量变量的项目。

综上所述，选项 D 是错误的，因为层次聚类不适合处理非常大或高维的数据集。