考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

某电商公司希望构建一个模型来预测用户是否会购买新推出的“会员礼包”。数据集中包含用户的年龄(连续数值)、性别(类别)、历史消费金额(连续数值)以及是否点击过推广邮件(类别)。关于使用决策树算法解决此问题,以下说法错误的是:
A. 决策树既可以处理离散型特征(如性别),也可以处理连续型特征(如年龄),无需像某些算法那样必须进行严格的标准化预处理。
B. 决策树生成的模型具有天然的“白盒”特性,业务人员可以直接理解其判断逻辑。
C. 决策树特别适合处理特征之间存在高度线性相关性的数据,其效果通常优于逻辑回归。
D. 如果数据中存在大量缺失值,某些决策树实现(如C4.5或CART的变体)能够直接处理或通过特定策略进行分裂,而无需立即删除样本。
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

选项C错误。决策树并不特别依赖特征间的线性关系,相反,它们擅长捕捉非线性关系和特征交互。当特征间存在高度线性相关性(多重共线性)时,逻辑回归等线性模型可能会不稳定,但决策树通常能从中选择一个最优特征进行分裂,不受多重共线性的严重困扰,但这并不是说它“特别适合处理高度线性相关性数据且效果优于逻辑回归”,在某些线性可分极强的简单场景下,逻辑回归可能更稳健且不易过拟合。选项A、B、D均为决策树的典型优势。