考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

某大型连锁零售集团在2026年面临激烈的市场竞争,为了优化供应链管理和提升客户忠诚度,集团数据科学部收集了旗下500家门店及百万级会员的详细运营数据。数据集主要包含两个部分: 1.商品维度数据:涵盖3000种SKU的月度销售指标,包括销售额、销售量、毛利率、库存周转天数、促销频率、退货率以及供应商交货准时率。 2.用户维度数据:涵盖会员的近期消费行为,包括最近一次消费时间(Recency)、消费频率(Frequency)、消费金额(Monetary)、浏览未购买次数、客诉次数以及会员等级。 数据分析师小李负责利用统计分析技术挖掘数据价值,具体任务涉及商品分类策略制定、用户画像构建、流失预警及关键驱动因素识别。 作为该项目的数据分析师,你需要依据主成分分析、因子分析、决策树、聚类等技术的原理,解决以下关键问题。 (5)针对即将到来的“年中大促”,小李需要预测不同用户群体对促销活动的响应情况(响应/不响应)。他计划使用决策树模型,因为业务部门希望得到清晰的“如果...那么...”式的执行策略,而不仅仅是概率值。为了制定大促策略,小李构建了决策树模型预测用户响应。模型生成了一条规则:“IF 会员等级=‘黄金’ AND 近30天浏览>3次 THEN 响应=‘是’(概率0.85)”。业务经理问:“为什么不用逻辑回归而用决策树?”以下关于决策树在此场景优势的描述,不正确的是?
A. 决策树生成的规则(IF-THEN)具有极高的可解释性,一线销售人员可以直接据此操作,无需理解复杂的数学公式。
B. 决策树能够自动捕捉变量间的非线性关系和交互作用(如“会员等级”和“浏览次数”的组合效应),无需人工构造交互项。
C. 决策树对异常值和不满足正态分布的数据不敏感,且不需要对数据进行标准化预处理。
D. 决策树模型通常比逻辑回归具有更好的泛化能力,完全不需要剪枝(Pruning)处理,永远不会出现过拟合。
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

A选项正确:这是决策树最大的业务优势之一,规则清晰易懂,便于落地执行。 B选项正确:决策树通过层层分裂,天然地处理了特征之间的交互作用和非线性关系,而逻辑回归通常需要手动添加交互项或多项式项。 C选项正确:决策树基于数据的排序和分割,不受数据分布形态影响,也不受量纲影响,因此鲁棒性较强,无需标准化。 D选项错误:决策树非常容易过拟合(Overfitting),特别是当树生长得过深时,会记住训练数据中的噪声。因此,必须进行剪枝(预剪枝或后剪枝)或限制树的最大深度来提高泛化能力。说它“完全不需要剪枝”、“永远不会过拟合”是严重的错误。 故选D。