本题考查多元线性回归模型相关知识。交互变量表示两个变量之间存在交互作用,在方程中常体现为两者相乘而不是求和,因此B选项表述错误,本题应选B。
在多元回归分析中,变量的处理和变换是非常重要的。我们来逐一分析选项,以确定哪个说法是不正确的。
A: 典型的非线性变换包括自然对数,平方根,倒数和平方
- 这个说法是正确的。在回归分析中,非线性变换如自然对数、平方根、倒数和平方常常用于处理数据,以提高模型的拟合度或满足线性回归模型的假设。
B: 交互变量表示两个变量之间存在交互作用,在方程中常体现为两者之和
- 这个说法是不正确的。交互变量(交互项)表示两个变量之间的交互作用,通常在回归方程中体现为两个变量的乘积,而不是两者之和。例如,如果我们有两个变量 \(X_1\) 和 \(X_2\),它们的交互项通常表示为 \(X_1 \times X_2\),而不是 \(X_1 + X_2\)。
C: 创建虚拟/哑变量(dummy variables)可以将定性的变量量化
- 这个说法是正确的。虚拟变量(哑变量)是用于将定性变量(如性别、地区等)转换为定量形式,以便在回归分析中使用。
D: 如果一个定性变量中有m种互斥的属性类型,在模型中需要引入m-1个虚拟/哑变量
- 这个说法是正确的。如果一个定性变量有 \(m\) 种互斥的属性类型,通常需要引入 \(m-1\) 个虚拟变量来避免多重共线性问题(即虚拟变量陷阱)。
因此,正确答案是 B: 交互变量表示两个变量之间存在交互作用,在方程中常体现为两者之和。