本题考察“维度灾难”对不同算法的具体影响机制。
o C 正确:KNN对无关特征最敏感。因为KNN计算距离时会累加所有维度的差值。那90个噪声维度的随机波动会产生巨大的距离干扰,淹没掉10个有效维度的真实距离信息,导致“近邻”变得随机。
o A 错误:L1正则化(Lasso)天生具有特征选择能力,能将无关特征的权重压缩为0。
o B/D 错误:决策树算法基于信息增益(或Gini系数)选择分裂特征。在分裂节点时,算法会扫描所有特征,优先选择能区分目标的有效特征,而忽略无关特征。因此树模型对无关特征具有很强的天然鲁棒性。