将虚拟变量放入回归中,一定要少放一个虚拟变量,否则系统会提示存在多重 共线性问题。故本题选B。
在统计学中,名目变量(也称为分类变量)通常需要转换为虚拟变量(dummy variables)以便在回归模型中使用。如果一个名目尺度的变量被分为10组,那么需要设计的虚拟变量数目可以通过以下方法确定:
对于一个有 \( k \) 个类别的名目变量,通常需要 \( k-1 \) 个虚拟变量来表示。原因是使用 \( k-1 \) 个虚拟变量可以唯一地表示所有 \( k \) 个类别,而不需要冗余信息。具体来说,可以通过 \( k-1 \) 个虚拟变量的组合来表示第 \( k \) 个类别。
因此,如果名目尺度的变量被分为10组,则需要设计的虚拟变量数为 \( 10-1=9 \)。
所以,正确答案是:B: 9
专业分析:
1. **名目变量的定义**:名目变量是指那些没有内在顺序的分类变量,例如颜色(红、蓝、绿)、性别(男、女)等。
2. **虚拟变量的设计**:虚拟变量是二进制(0或1)的变量,用于表示名目变量的不同类别。每个虚拟变量表示一个类别是否存在。
3. **虚拟变量的数量**:对于一个有 \( k \) 个类别的名目变量,使用 \( k-1 \) 个虚拟变量就可以唯一地表示所有类别。这是因为第 \( k \) 个类别可以通过所有虚拟变量都为0来表示,从而避免了多重共线性问题。
例如:
- 如果名目变量有3个类别(A, B, C),则需要2个虚拟变量:
- \( D1 \): A=1, B=0, C=0
- \( D2 \): A=0, B=1, C=0
- 如果 \( D1 \) 和 \( D2 \) 都为0,则表示类别C。
按照这个逻辑,如果名目变量有10个类别,则需要9个虚拟变量来表示。