考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

你正在带队开发一个“电商平台客单价(LTV)预测”模型,用于辅助制定营销预算。该业务的数据呈现典型的长尾分布:99% 的用户消费金额在 10-500 元之间,但有 1% 的“头部大户”消费金额超过 10 万元。 在模型评估时,发现模型在“大户”样本上的预测偏差为 20%(绝对误差数万元),而在普通用户身上偏差仅 1%(绝对误差几元)。关于评估指标的表现,下列推断最准确的是:
A. RMSE(均方根误差) 会由于平方效应被“大户”样本的巨大绝对误差主导,导致该指标无法有效表征模型在 99% 普通用户群体上的拟合效果。
B. MAPE(平均绝对百分比误差) 对不同数量级的样本具有天然的归一化作用,因此在大户和普通用户并存的场景下,它是评估业务盈亏平衡的最优单一核心指标。
C. MAE(平均绝对误差) 相比 RMSE 能显著降低离群值的影响,在本场景中它可以完全消除大额订单对评估结果的干扰,使其等同于中位数预测。
D. 为了兼顾高低消费人群的预测准确性,应采用 RMSLE(对数均方根误差),其核心逻辑是通过对数变换增加模型对高绝对误差的敏感度,从而强制模型拟合大户。
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

RMSE 由于对误差进行了平方运算,对离群值(Outliers)或大数值样本的误差非常敏感。在该场景下,1% 大户产生的数万元误差平方后会直接主导 RMSE 的数值,掩盖模型在 99% 基础用户上的性能。MAPE 虽然在比例上对等,但在实际业务中,由于低客单价用户的分母小,极小的绝对误差也可能产生巨大的百分比误差(如预测 2 元实际 1 元,误差 100%),同样存在缺陷。通常此类场景建议使用 RMSLE(对数均方根误差),它能缩小大数值的影响,且关注相对误差。D 选项的前半句建议使用 RMSLE 是正确的(这是长尾分布的常用技巧),但后半句理由错误。对数变换的目的是压缩数值范围,降低大数值样本的绝对误差对损失函数的影响,使模型对“相对误差”更敏感,而不是“增加对高绝对误差的敏感度”。