考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

在构建分析高风险用户的模型时,一位资深分析师发现“用户在申请前30分钟内修改密码的次数”这一特征在XGBoost模型中具有极高的特征重要性(Feature Importance)。但在模型上线灰度测试后,该特征的区分度大幅下降。经排查,发现申请流程中:若系统判定用户有高风险,会强制跳转至“修改密码并二次验证”页面。关于这一现象,从数据挖掘的“隐性知识显性化”角度审视,以下说法最准确的是:
A. 这属于典型的“幸存者偏差”,因为只有最终完成申请的用户才会进入样本库。
B. 该特征产生了“目标泄露”,因为特征的取值受到了模型预测目标(风险识别过程)的逆向影响。
C. 这种现象说明该特征具有极强的时效性,应当从离线批量计算改为在线流式特征计算。
D. 这是由于特征工程阶段未进行归一化导致的,模型被异常大的特征值诱导产生了过拟合。
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

在工业界建模中,最隐蔽的错误之一就是“闭环系统中的目标泄露”。题目描述的修改密码行为,本质上是业务流程中“风控干预”的结果,而非“风险产生”的原因。这种“因果倒置”导致特征中包含了预测目标的信息,使得离线效果虚高。高级分析师必须能识别出业务流程对数据生成过程(DGP)的污染。