B选项错误的原因是逻辑回归自变量和目标变量是非线性关系,经过了logit变 换。逻辑回归可以看做是具有0个隐藏层的神经网络,一般意义上的神经网络比逻辑回归模 型要复杂,因此从这个角度讲,神经网络比逻辑回归更容易过拟合,所以C的说法有误。逻 辑回归不仅能做二值分类,也能做多值分类,故D选项错误。
关于逻辑回归的说法正确的是(A)。以下是对各个选项的专业分析:
A: 逻辑回归的估计方法是最大似然估计
这个说法是正确的。逻辑回归模型使用最大似然估计方法来估计模型参数。最大似然估计通过找到使得观测数据出现的概率最大的参数值来进行估计。
B: 逻辑回归要求自变量和目标变量是线性关系
这个说法是不正确的。逻辑回归并不要求自变量和目标变量之间是线性关系,而是要求自变量和目标变量的对数几率(log-odds)之间是线性关系。换句话说,逻辑回归模型假设自变量的线性组合与目标变量的对数几率之间存在线性关系。
C: 逻辑回归比神经网络,更容易过度拟合
这个说法是不准确的。逻辑回归是一种比较简单的模型,相对于复杂的神经网络,它通常不太容易发生过度拟合。神经网络由于其复杂性和高容量,更容易在训练数据上表现出过度拟合的现象。
D: 逻辑回归只能做2值分类,不能做多值分类
这个说法是不全面的。虽然标准的逻辑回归模型是用于二分类问题,但可以通过扩展逻辑回归模型(如多项逻辑回归)来处理多值分类问题。因此,逻辑回归不仅能做二值分类,也能做多值分类。
综合以上分析,正确答案是A。