考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

某新闻资讯APP上线了一种新的推荐算法模型,旨在提高用户的人均阅读时长。A/B测试结果显示:新算法组(实验组)的总体人均阅读时长比旧算法组(对照组)下降了5%。然而,当数据分析师将用户按“活跃度等级”(高、中、低)分层后发现,新算法在每一个分层中的人均阅读时长都比旧算法高出2%~3%。 针对这一现象,以下哪种解释和后续动作最为合理?
A. 新算法导致了用户活跃度分布发生变化(如低活跃用户占比变大),应重新加权评估或关注分层指标,不应急于下线新算法。
B. 分层分析结果不可靠,样本量变小导致方差变大,应以总体指标为准,判定新算法失败,立即下线。
C. 说明新算法对高活跃用户存在“杀熟”现象,虽然单次阅读长,但导致高活用户流失,必须回滚模型。
D. 数据存在异常值(Outliers),应剔除各组中阅读时长最长的前1%用户后重新计算总体均值。
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

这是经典的辛普森悖论案例。 • 现象:分组比较都好,总体比较变差。 • 原因:通常是因为实验组中“低表现组”(如低活跃用户,本身阅读时长就短)的样本占比显著增加了。例如,新算法可能召回了大量原本已经快流失的低活用户,这部分人虽然阅读时长提升了,但因为基数大且绝对值低,拉低了实验组的整体均值。 • 决策:A选项正确。这可能说明新算法在促活方面有效,单纯看总体均值会误判,应该分析用户结构的变化。