考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

你所在的团队负责某大型公有云平台的“竞价实例(Spot Instances)”智能调度系统。竞价实例允许用户以大幅折扣(通常为按需价格的10%-20%)购买闲置算力,但云平台保留在资源紧张时强制回收(Pre-empt)这些实例的权利。 为了降低用户的使用风险并优化平台的资源利用率,团队需要构建一个“实例中断概率预测模型”。 ##### 输入数据: - 集群状态数据:过去30天的集群CPU/内存水位、历史供需曲线(分钟级)。 - 用户画像数据:用户历史出价行为、作业类型(Web服务/离线计算)、历史续费率、所属行业。 - 实例特征:实例规格(如8核16G)、所在的可用区(AZ)、运行时长。 - o 预测目标:预测当前运行的实例在未来1小时内是否会被系统强制回收(Binary Classification)。 ##### 业务约束: 1. 极度不平衡:实际发生强制回收的概率极低(约1%),样本极度不平衡。 2. 非对称成本:如果模型漏报(FN),导致用户作业运行中途被杀且无预警,平台需支付高额SLA赔偿且严重损害商誉;如果模型误报(FP),导致用户提前迁移作业,仅造成少量的计算成本浪费。 3. 时效性:模型需支持近实时推断。 (4)模型训练完成后,特征重要性分析显示“集群整体CPU利用率”是Top 3的重要特征。然而,在进行单调性校验(Partial Dependence Plot, PDP)时发现:在CPU利用率极高(>90%)的区间,模型预测的中断概率反而出现了下降。经排查,这是因为在极端高负载下,平台运维团队会人工介入锁死资源,禁止任何自动回收操作。为了保证模型逻辑符合业务直觉(即:负载越高,风险应当越大或持平),且不希望模型学习到这种“人工干预产生的统计偏差”,在Retrain阶段最恰当的技术手段是:
A. 对“集群CPU利用率”特征进行分箱(Binning),将>90%的部分单独作为一个箱。
B. 在XGBoost/LightGBM中对该特征施加单调性约束(Monotonic Constraints),强制要求输出随CPU利用率单调递增。
C. 剔除CPU利用率>90%的训练样本,认为是异常点。
D. 增加树的深度(Max Depth),让模型能够学习到更复杂的非线性关系。
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

本题考察模型的可解释性与领域知识注入(Domain Knowledge Injection)。 • B选项(正确):树模型在缺乏约束时会纯粹拟合数据中的统计规律(哪怕是因人工干预导致的假规律)。Monotonic Constraints允许我们在训练时注入先验知识,强制模型在特定特征上保持单调递增或递减。这能防止模型在特定区间出现违反业务常识的“倒钩”,提高模型的鲁棒性和业务可解释性。 • A选项:分箱只能离散化,模型仍然可能学习到该箱对应的权重较低(概率下降)。 • C选项:剔除样本会丢失高负载下的其他有效信息,且线上推断时依然会遇到>90%的情况,导致模型外推未知。 • D选项:增加树深只会让模型更好地拟合这个“错误”的规律(过拟合),反而加剧问题。