-CDA考试官方模拟题库

备考刷题，请到

CDA认证小程序

某信贷审批模型（基于XGBoost）拒绝了一位信用良好的老客户的贷款申请。客户投诉要求解释。MLOps团队提取了该样本，使用SHAP（SHapley Additive exPlanations）值进行归因分析。分析结果显示，“账户余额”这一特征的SHAP值为负，导致了预测分数的下降。然而，业务人员指出该客户的“账户余额”非常高，按照常理应是加分项。进一步检查发现，该特征与“近期大额消费”存在极强的共线性（Multicollinearity）。在此场景下，关于SHAP值的解释，以下说法正确的是：

A. SHAP值具有加性属性，因此即使存在共线性，该特征的负贡献也是绝对准确的业务因果反映

B. XGBoost处理共线性特征时会随机选择分裂点，导致特征重要性和SHAP值在共线性特征间分散，可能出现违反直觉的归因方向

C. 应当改用LIME（Local Interpretable Model-agnostic Explanations），因为LIME对共线性完全免疫

D. 这是一个模型过拟合的迹象，必须通过增加L1正则化来解决解释性问题

上一题

下一题

题目解析

题目评论(0)

• 核心考点：树模型、共线性与解释性工具的局限性。 • A选项错误：SHAP值在数学上是加性的，但在存在强共线性时，模型可以利用特征A的负面作用去抵消特征B的过高正面作用（即使两者高度相关），导致单看特征A时出现违反业务直觉的符号。 • C选项错误：LIME通过扰动数据拟合局部线性模型，在强共线性存在时，扰动产生的数据点可能落在不合理的数据分布区域，解释性同样不可靠。 • D选项错误：这主要不是过拟合问题，而是相关性处理问题。 • B选项正确：树模型在面对共线性特征时，分裂点的选择具有随机性（或取决于具体的贪心算法路径）。这会导致特征重要性被稀释或在相关特征间震荡，使得单一特征的SHAP值无法真实反映其独立的业务贡献（Causal impact）。