考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

你所在的电商平台“TechMall”即将举行年度最大的“超级品牌日”活动,核心引流项目是“53度飞天茅台1499元整点秒杀”。由于商品存在巨大的二级市场价差,该活动吸引了大量“黑产”(羊毛党、机器脚本、群控设备)进行抢购。 业务痛点: 1. 极度不平衡与标签缺失:在数千万次请求中,只有极少数是真正的黑产攻击,且平台只能确认部分被投诉的账号是黑产(Positive),以及部分长期高活的忠实用户是正常(Negative),海量中间用户的性质是未知的(Unlabeled)。 2. 高并发低时延:秒杀开启瞬间QPS(每秒查询率)破十万,风控模型必须在20ms内返回拦截决策。 3. 对抗性强:黑产会不断变换IP、设备指纹、UA等特征来绕过规则。 4. 误杀成本高:如果误拦截了平台的高价值VIP用户,会导致严重的客诉和品牌舆情危机。 数据团队决定构建一套基于实时行为序列与 LightGBM+LSTM 的模型。请基于此背景回答以下5道题。 (5)模型上线初期效果显著,但在“双十一”零点流量洪峰到来后的30分钟内,拦截率突然断崖式下跌,且大量未知的新型黑产账号成功下单。事后分析发现,黑产团伙启用了全新的IP段和从未见过的设备指纹格式,导致特征分布发生了剧烈的概念漂移(Concept Drift)。 为了应对这种突发性、对抗性的分布变化,以下哪种策略是最实时且有效的应急手段?
A. 立即触发离线重训练流程(Retrain),将过去30分钟的数据加入全量历史数据中,训练数小时后更新模型。
B. 启用基于FTRL(Follow-the-Regularized-Leader)的在线学习模块,对ID类特征(如IP、DeviceID)的权重进行实时更新。
C. 采用T-test(T检验)检测特征均值变化,一旦发现变化显著,自动回滚到上一个版本的模型。
D. 使用无监督的孤立森林(Isolation Forest)算法替换现有的监督模型进行全量拦截。
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

本题考察在线学习与对抗性环境下的模型维护。 • A选项:错误。太慢了。离线重训练通常耗时小时级,甚至天级,无法应对“双十一”仅持续几小时的洪峰和秒级变化的黑产攻击。 • B选项:正确。FTRL 是工业界处理稀疏高维特征最经典的在线学习优化算法。它可以根据实时反馈的样本(比如后端的实时风控校验结果或人工打标),在毫秒级更新模型中ID类特征的权重。当黑产启用新IP时,FTRL能迅速捕捉到该IP的高风险倾向并大幅提升其权重,实现分钟级甚至秒级的模型自适应。 • C选项:错误。概念漂移发生时,旧模型已经失效,回滚旧模型无法解决新攻击问题。 • D选项:错误。无监督算法在缺乏先验知识的情况下,容易产生不可控的误杀,且其推断延迟通常高于简单的线性或树模型,不适合直接替换全量拦截模型。