考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

层次聚类中,聚类的变量类型是( )
A. 连续变量
B. 分类变量
C. 两者都可以
D. 不确定
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

层次聚类的变量可以是连续变量,也可以是分类变量。

正确答案是:C: 两者都可以。

### 专业分析

层次聚类是一种将数据分组的无监督学习方法,主要有两种形式:凝聚的(自底向上)和分裂的(自顶向下)。在层次聚类中,可以使用不同类型的数据变量进行聚类,包括连续变量和分类变量:

1. **连续变量**:
- 这是指可用数值来表示的数据,如身高、体重等。
- 在层次聚类中,通常通过计算距离(如欧氏距离)来判断两个数据点之间的相似性。

2. **分类变量**:
- 这是指可以分类的非数值数据,如性别、颜色等。
- 对分类变量的聚类通常需要使用专门的相似性度量方法,如汉明距离或基于频率的方法。

### 使用示例

| 数据点 | 特征1(连续) | 特征2(分类) |
|--------|---------------|---------------|
| 点1 | 1.5 | 红色 |
| 点2 | 2.3 | 绿色 |
| 点3 | 3.8 | 红色 |
| 点4 | 1.2 | 蓝色 |

在这种情况下,层次聚类算法可以同时综合考虑连续变量和分类变量之间的相似性,进行有效的聚类分析。

### 结论

因此,层次聚类能够处理连续和分类变量。在应用时可以根据实际需求,选择适合的相似性度量方法,以提高聚类结果的准确性和效用。