本题考察树模型的超参数调优原理。
• A选项:错误。增加叶子节点数和减小叶子最小样本数都会让模型切分得更细,捕捉更多噪声,从而加剧过拟合。
• B选项:错误。减小学习率通常需要增加迭代次数才能达到收敛,否则会导致欠拟合。
• C选项:正确。LightGBM的Leaf-wise策略容易长出很深的树(针对某些特定样本一直切分)。限制 max_depth 可以防止树生长过深;增大 min_gain_to_split 意味着只有当分裂带来的纯度提升足够大时才分裂,这相当于一种预剪枝(Pre-pruning),能有效抑制过拟合。
• D选项:错误。特征采样和行采样(Bagging)是随机森林思想的引入,用于增加随机性、防止过拟合。关闭它们(设为1.0和关闭)会降低模型的抗干扰能力。