在线性回归分析中,残差是指观察值与预测值之间的差异。关于残差均值的说法,正确的是:
**A: 残差均值总是为0**
### 专业分析:
- **定义**:
- **残差 (e)**:残差是实际观测值 \((y_i)\) 与模型预测值 \((\hat{y}_i)\) 之间的差,即 \( e_i = y_i - \hat{y}_i \)。
- **性质**:
- 在经典线性回归模型中,通过最小二乘法(OLS, Ordinary Least Squares)估计参数时,残差的均值被约束为零。这个特性源于最小化残差平方和的过程。
- **数学证明**:
- 设线性回归模型为 \( y = X\beta + \epsilon \),其中 \( y \) 是因变量向量,\( X \) 是自变量矩阵,\( \beta \) 是参数向量,\( \epsilon \) 是误差项。
- 最小二乘法估计得出的 \(\hat{y} = X\hat{\beta}\),而残差 \( e = y - \hat{y} \)。
- 在数学上,通过最小化残差平方和 \( \sum (y_i - \hat{y}_i)^2 \),我们得出一个性质:\(\sum e_i = 0\),即残差的和为零,从而残差的均值为0。
- **实际意义**:
- 残差均值为零意味着模型在样本上没有系统性偏差,即预测值在总体上与实际值的偏差方向是均衡的。
因此,正确答案是A,残差均值总是为0。