考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

某信贷审批模型(基于XGBoost)拒绝了一位信用良好的老客户的贷款申请。客户投诉要求解释。MLOps团队提取了该样本,使用SHAP(SHapley Additive exPlanations)值进行归因分析。分析结果显示,“账户余额”这一特征的SHAP值为负,导致了预测分数的下降。然而,业务人员指出该客户的“账户余额”非常高,按照常理应是加分项。进一步检查发现,该特征与“近期大额消费”存在极强的共线性(Multicollinearity)。在此场景下,关于SHAP值的解释,以下说法正确的是:
A. SHAP值具有加性属性,因此即使存在共线性,该特征的负贡献也是绝对准确的业务因果反映
B. XGBoost处理共线性特征时会随机选择分裂点,导致特征重要性和SHAP值在共线性特征间分散,可能出现违反直觉的归因方向
C. 应当改用LIME(Local Interpretable Model-agnostic Explanations),因为LIME对共线性完全免疫
D. 这是一个模型过拟合的迹象,必须通过增加L1正则化来解决解释性问题
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

• 核心考点: 树模型、共线性与解释性工具的局限性。 • A选项错误:SHAP值在数学上是加性的,但在存在强共线性时,模型可以利用特征A的负面作用去抵消特征B的过高正面作用(即使两者高度相关),导致单看特征A时出现违反业务直觉的符号。 • C选项错误:LIME通过扰动数据拟合局部线性模型,在强共线性存在时,扰动产生的数据点可能落在不合理的数据分布区域,解释性同样不可靠。 • D选项错误:这主要不是过拟合问题,而是相关性处理问题。 • B选项正确:树模型在面对共线性特征时,分裂点的选择具有随机性(或取决于具体的贪心算法路径)。这会导致特征重要性被稀释或在相关特征间震荡,使得单一特征的SHAP值无法真实反映其独立的业务贡献(Causal impact)。