-CDA考试官方模拟题库

备考刷题，请到

CDA认证小程序

某电商公司希望构建一个模型来预测用户是否会购买新推出的“会员礼包”。数据集中包含用户的年龄（连续数值）、性别（类别）、历史消费金额（连续数值）以及是否点击过推广邮件（类别）。关于使用决策树算法解决此问题，以下说法错误的是：

A. 决策树既可以处理离散型特征（如性别），也可以处理连续型特征（如年龄），无需像某些算法那样必须进行严格的标准化预处理。

B. 决策树生成的模型具有天然的“白盒”特性，业务人员可以直接理解其判断逻辑。

C. 决策树特别适合处理特征之间存在高度线性相关性的数据，其效果通常优于逻辑回归。

D. 如果数据中存在大量缺失值，某些决策树实现（如C4.5或CART的变体）能够直接处理或通过特定策略进行分裂，而无需立即删除样本。

上一题

下一题

题目解析

题目评论(0)

选项C错误。决策树并不特别依赖特征间的线性关系，相反，它们擅长捕捉非线性关系和特征交互。当特征间存在高度线性相关性（多重共线性）时，逻辑回归等线性模型可能会不稳定，但决策树通常能从中选择一个最优特征进行分裂，不受多重共线性的严重困扰，但这并不是说它“特别适合处理高度线性相关性数据且效果优于逻辑回归”，在某些线性可分极强的简单场景下，逻辑回归可能更稳健且不易过拟合。选项A、B、D均为决策树的典型优势。