层次聚类变量类型是什么-CDA考试官方模拟题库

备考刷题，请到

CDA认证小程序

层次聚类中，聚类的变量类型是（）

A. 连续变量

B. 分类变量

C. 两者都可以

D. 不确定

上一题

下一题

题目解析

题目评论(0)

层次聚类的变量可以是连续变量，也可以是分类变量。

正确答案是：C: 两者都可以。

### 专业分析

层次聚类是一种将数据分组的无监督学习方法，主要有两种形式：凝聚的（自底向上）和分裂的（自顶向下）。在层次聚类中，可以使用不同类型的数据变量进行聚类，包括连续变量和分类变量：

1. **连续变量**：
- 这是指可用数值来表示的数据，如身高、体重等。
- 在层次聚类中，通常通过计算距离（如欧氏距离）来判断两个数据点之间的相似性。

2. **分类变量**：
- 这是指可以分类的非数值数据，如性别、颜色等。
- 对分类变量的聚类通常需要使用专门的相似性度量方法，如汉明距离或基于频率的方法。

### 使用示例

| 数据点 | 特征1（连续） | 特征2（分类） |
|--------|---------------|---------------|
| 点1 | 1.5 | 红色 |
| 点2 | 2.3 | 绿色 |
| 点3 | 3.8 | 红色 |
| 点4 | 1.2 | 蓝色 |

在这种情况下，层次聚类算法可以同时综合考虑连续变量和分类变量之间的相似性，进行有效的聚类分析。

### 结论

因此，层次聚类能够处理连续和分类变量。在应用时可以根据实际需求，选择适合的相似性度量方法，以提高聚类结果的准确性和效用。