考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

某电信运营商先使用K-Means算法将用户划分为4个群体(Cluster 0, 1, 2, 3),但业务人员无法直观理解每个群体的具体特征(如“高价值流失风险群”)。于是,分析师以"K-Means的聚类标签”作为目标变量(Y),以用户的原始行为数据(通话时长、流量使用、套餐资费等)作为特征(X),训练了一个决策树模型。 关于这一操作的目的和结果解读,下列说法正确的是:
A. 这一步是为了提高聚类的准确性,决策树会重新调整K-Means的质心位置。
B. 决策树模型在此处的作用是“降维”,将高维数据映射到4个类别中以便存储。
C. 通过提取决策树的规则,可以将抽象的聚类标签转化为可解释的业务规则(例如:“若月流量>20G且投诉次数>1,则属于Cluster 2"),从而赋予分群业务含义。
D. 这种方法会导致过拟合,因为K-Means是无监督学习,不能用有监督的决策树去拟合。
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

这是数据挖掘中经典的“聚类+分类”组合拳。K-Means负责发现数据的内在结构(分群),但缺乏语义解释;决策树作为可解释性强的有监督模型,通过学习“特征->聚类标签”的映射关系,能够提取出区分各个簇的关键规则,从而帮助业务人员理解每个簇的特征(即“画像”)。选项A错误,决策树不改变K-Means结果;选项B不是主要目的,主要目的是解释;选项D错误,这是一种合法且常用的分析手段,旨在解释聚类结果。