考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?
A. 分类
B. 聚类
C. 关联分析
D. 隐马尔可夫链
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

正确答案是:B: 聚类

### 专业分析

聚类是一种无监督学习技术,用于将数据集中的对象分组,以便同一组中的对象彼此之间有更高的相似性,而与其他组中的对象有更大的不同。以下是对选项的详细分析:

- **A: 分类**
- 分类是一种有监督学习方法,需要已标记的数据来训练模型,以预测未见数据的标签。在有标签情况下使用,而题目中提到的是“不知道数据所带标签时”。

- **B: 聚类**
- 聚类不需要预先知道数据的标签,是一种无监督学习技术。它通过识别数据固有的结构,使得同一类别的样本尽可能相似,而不同类别的样本尽可能不同。这正是题目中要求“促使带同类标签的数据与带其他标签的数据相分离”的核心。

- **C: 关联分析**
- 关联分析主要用于发现数据集中的关联规则或模式,常用于市场购物篮分析。它关注的是变量之间的关联关系,而不是将数据进行分类或分组。

- **D: 隐马尔可夫链**
- 隐马尔可夫链是一种统计模型,用于描述具有隐含状态的随机过程。虽然它可以用于预测和分类问题,但其目的不在于分离数据集中的不同类别标签。

### 结论

在不知道数据所带标签的情况下,聚类技术通过对数据进行分组,使得组内数据相似度高,而组间相似度低,是最适用的方法。