-CDA考试官方模拟题库

备考刷题，请到

CDA认证小程序

某大型连锁零售集团在2026年面临激烈的市场竞争，为了优化供应链管理和提升客户忠诚度，集团数据科学部收集了旗下500家门店及百万级会员的详细运营数据。数据集主要包含两个部分： 1.商品维度数据：涵盖3000种SKU的月度销售指标，包括销售额、销售量、毛利率、库存周转天数、促销频率、退货率以及供应商交货准时率。 2.用户维度数据：涵盖会员的近期消费行为，包括最近一次消费时间（Recency）、消费频率（Frequency）、消费金额（Monetary）、浏览未购买次数、客诉次数以及会员等级。数据分析师小李负责利用统计分析技术挖掘数据价值，具体任务涉及商品分类策略制定、用户画像构建、流失预警及关键驱动因素识别。作为该项目的数据分析师，你需要依据主成分分析、因子分析、决策树、聚类等技术的原理，解决以下关键问题。（5）针对即将到来的“年中大促”，小李需要预测不同用户群体对促销活动的响应情况（响应/不响应）。他计划使用决策树模型，因为业务部门希望得到清晰的“如果...那么...”式的执行策略，而不仅仅是概率值。为了制定大促策略，小李构建了决策树模型预测用户响应。模型生成了一条规则：“IF 会员等级=‘黄金’ AND 近30天浏览>3次 THEN 响应=‘是’（概率0.85）”。业务经理问：“为什么不用逻辑回归而用决策树？”以下关于决策树在此场景优势的描述，不正确的是？

A. 决策树生成的规则（IF-THEN）具有极高的可解释性，一线销售人员可以直接据此操作，无需理解复杂的数学公式。

B. 决策树能够自动捕捉变量间的非线性关系和交互作用（如“会员等级”和“浏览次数”的组合效应），无需人工构造交互项。

C. 决策树对异常值和不满足正态分布的数据不敏感，且不需要对数据进行标准化预处理。

D. 决策树模型通常比逻辑回归具有更好的泛化能力，完全不需要剪枝（Pruning）处理，永远不会出现过拟合。

上一题

下一题

题目解析

题目评论(0)

A选项正确：这是决策树最大的业务优势之一，规则清晰易懂，便于落地执行。 B选项正确：决策树通过层层分裂，天然地处理了特征之间的交互作用和非线性关系，而逻辑回归通常需要手动添加交互项或多项式项。 C选项正确：决策树基于数据的排序和分割，不受数据分布形态影响，也不受量纲影响，因此鲁棒性较强，无需标准化。 D选项错误：决策树非常容易过拟合（Overfitting），特别是当树生长得过深时，会记住训练数据中的噪声。因此，必须进行剪枝（预剪枝或后剪枝）或限制树的最大深度来提高泛化能力。说它“完全不需要剪枝”、“永远不会过拟合”是严重的错误。故选D。