• 核心考点: 树模型、共线性与解释性工具的局限性。
• A选项错误:SHAP值在数学上是加性的,但在存在强共线性时,模型可以利用特征A的负面作用去抵消特征B的过高正面作用(即使两者高度相关),导致单看特征A时出现违反业务直觉的符号。
• C选项错误:LIME通过扰动数据拟合局部线性模型,在强共线性存在时,扰动产生的数据点可能落在不合理的数据分布区域,解释性同样不可靠。
• D选项错误:这主要不是过拟合问题,而是相关性处理问题。
• B选项正确:树模型在面对共线性特征时,分裂点的选择具有随机性(或取决于具体的贪心算法路径)。这会导致特征重要性被稀释或在相关特征间震荡,使得单一特征的SHAP值无法真实反映其独立的业务贡献(Causal impact)。