层次聚类由于需要反复计算距离,限制了层次聚类的速度。因此不适用于数据量非常大或者变量非常多的项目。
在层次聚类的描述中,错误的选项是 D: 层次聚类适用于数据量非常大或者变量非常多的项目。
### 分析:
1. **A: 层次聚类也叫作系统聚类**
- 这种说法是正确的。层次聚类(Hierarchical Clustering)确实也被称为系统聚类,因为它以层次的方式构建聚类,形成一个树状结构。
2. **B: 层次聚类法通常分为自底向上和自顶向下**
- 这也是正确的。层次聚类有两种主要方法:
- 自底向上(凝聚的):从每个数据点开始,不断将最近的两个聚类合并。
- 自顶向下(分裂的):从所有数据组成一个大聚类开始,不断将其分裂成更小的子聚类。
3. **C: 层次聚类的过程非常清楚,会形成类似树状的聚类图谱,便于理解和检查**
- 正确。层次聚类的结果可以表示为树状图(树状图也被称为树状图表或树状图谱),这使得聚类过程透明并且便于理解和分析。
4. **D: 层次聚类适用于数据量非常大或者变量非常多的项目**
- 错误。层次聚类的计算复杂度较高,随着数据量和变量的增加,其计算成本和内存需求会显著增加。因此,层次聚类通常不适用于非常大数据集或具有大量变量的项目。
综上所述,选项 D 是错误的,因为层次聚类不适合处理非常大或高维的数据集。