正确答案是:C: 线性回归模型。
### 分析
线性回归模型是最容易受到异常值影响的原因主要包括以下几点:
1. **模型假设**:
- 线性回归假设数据服从正态分布并且存在线性关系。异常值会破坏这些假设,对回归直线的斜率和截距产生很大影响。
2. **损失函数**:
- 线性回归通常通过最小二乘法进行拟合,其目标是最小化误差的平方和。由于平方的关系,异常值的影响被放大,导致模型偏离大部分数据的趋势。
3. **参数估计的稳定性**:
- 线性回归依赖于所有数据点来估计模型参数。异常值可以显著改变斜率和截距的估计结果,使得模型在正常数据上表现不佳。
### 对比其他选项
- **感知机模型**:
- 虽然感知机在数据上进行线性分隔,但其目标是找到一个可以区分数据类别的超平面,而不是拟合数据点。因此,异常值的影响相对较小。
- **逻辑回归模型**:
- 虽然逻辑回归也受异常值影响,但由于其输出是概率,并且使用的是对数似然损失,其对异常值的敏感性较线性回归有所降低。
- **SVM模型**:
- 支持向量机(SVM)通过最大化间隔来找到最佳分隔超平面,主要依赖于少数支持向量。因为仅使用边界上的数据点构建模型,SVM对异常值的敏感性较低。
因此,在线性回归模型中,特别是当数据包含异常值时,应考虑使用鲁棒回归方法,如岭回归或采用数据预处理措施来减小其影响。