A选项错误:方案B分裂后,两个子节点的分布(25正25负)与父节点完全一致,纯度没有提升,信息增益为0。方案A分裂后,子节点纯度显著提升,信息增益大。
B选项正确:信息增益 = 父节点熵 - 加权平均子节点熵。方案A中,右子节点纯度为100%(全流失),左子节点纯度也较高(10/60流失),加权后的子节点熵远小于父节点熵,因此信息增益大。决策树倾向于选择信息增益大的属性进行分裂。
C选项错误:决策树(如CART算法)可以处理连续变量。它会自动寻找最佳分裂点(阈值),将连续变量转化为二值分裂(如:浏览次数 > 5)。
D选项错误:信息增益越大,意味着分裂后数据的混乱程度(熵)降低得越多,即子节点的纯度越高,而不是越高。
故选B。