新用户注册
备考刷题,请到
CDA认证小程序
Lasso 的特性:在存在强共线性特征(X_A,X_B)时,Lasso 的几何特性(菱形约束)倾向于随机保留其中一个,将另一个系数压为 0。如果它留下了X_B扔掉了X_A,就会出现题目描述的情况。决策树的特性:树模型在分裂节点时,计算的是当前状态下的信息增益(或 Gini 指数下降)。即使X_A和X_B高度相关,只要X_A的增益比X_B高出一点点(哪怕是因为噪声),树都会坚定地选择X_A做分裂点。这是工业界归因分析时的经典坑,Lasso 扔掉的特征不代表不重要,可能是被共线性特征代替了。