RMSE 由于对误差进行了平方运算,对离群值(Outliers)或大数值样本的误差非常敏感。在该场景下,1% 大户产生的数万元误差平方后会直接主导 RMSE 的数值,掩盖模型在 99% 基础用户上的性能。MAPE 虽然在比例上对等,但在实际业务中,由于低客单价用户的分母小,极小的绝对误差也可能产生巨大的百分比误差(如预测 2 元实际 1 元,误差 100%),同样存在缺陷。通常此类场景建议使用 RMSLE(对数均方根误差),它能缩小大数值的影响,且关注相对误差。D 选项的前半句建议使用 RMSLE 是正确的(这是长尾分布的常用技巧),但后半句理由错误。对数变换的目的是压缩数值范围,降低大数值样本的绝对误差对损失函数的影响,使模型对“相对误差”更敏感,而不是“增加对高绝对误差的敏感度”。