-CDA考试官方模拟题库

备考刷题，请到

CDA认证小程序

某电信运营商先使用K-Means算法将用户划分为4个群体（Cluster 0, 1, 2, 3），但业务人员无法直观理解每个群体的具体特征（如“高价值流失风险群”）。于是，分析师以"K-Means的聚类标签”作为目标变量（Y），以用户的原始行为数据（通话时长、流量使用、套餐资费等）作为特征（X），训练了一个决策树模型。关于这一操作的目的和结果解读，下列说法正确的是：

A. 这一步是为了提高聚类的准确性，决策树会重新调整K-Means的质心位置。

B. 决策树模型在此处的作用是“降维”，将高维数据映射到4个类别中以便存储。

C. 通过提取决策树的规则，可以将抽象的聚类标签转化为可解释的业务规则（例如：“若月流量>20G且投诉次数>1，则属于Cluster 2"），从而赋予分群业务含义。

D. 这种方法会导致过拟合，因为K-Means是无监督学习，不能用有监督的决策树去拟合。

上一题

下一题

题目解析

题目评论(1)

这是数据挖掘中经典的“聚类+分类”组合拳。K-Means负责发现数据的内在结构（分群），但缺乏语义解释；决策树作为可解释性强的有监督模型，通过学习“特征->聚类标签”的映射关系，能够提取出区分各个簇的关键规则，从而帮助业务人员理解每个簇的特征（即“画像”）。选项A错误，决策树不改变K-Means结果；选项B不是主要目的，主要目的是解释；选项D错误，这是一种合法且常用的分析手段，旨在解释聚类结果。

用户1431126

C选项才是正确的