本题考察模型的可解释性与领域知识注入(Domain Knowledge Injection)。
• B选项(正确):树模型在缺乏约束时会纯粹拟合数据中的统计规律(哪怕是因人工干预导致的假规律)。Monotonic Constraints允许我们在训练时注入先验知识,强制模型在特定特征上保持单调递增或递减。这能防止模型在特定区间出现违反业务常识的“倒钩”,提高模型的鲁棒性和业务可解释性。
• A选项:分箱只能离散化,模型仍然可能学习到该箱对应的权重较低(概率下降)。
• C选项:剔除样本会丢失高负载下的其他有效信息,且线上推断时依然会遇到>90%的情况,导致模型外推未知。
• D选项:增加树深只会让模型更好地拟合这个“错误”的规律(过拟合),反而加剧问题。