考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

某信贷机构用逻辑回归建立了一个用于客户违约的信用评分模型,模型的参数估计和检验信息如下: (4)一般来说,如果名目尺度的变量被分为10组,则需要设计的虚拟变量数为?
A. 8
B. 9
C. 10
D. 无法确定
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

将虚拟变量放入回归中,一定要少放一个虚拟变量,否则系统会提示存在多重 共线性问题。故本题选B。

在统计学中,名目变量(也称为分类变量)通常需要转换为虚拟变量(dummy variables)以便在回归模型中使用。如果一个名目尺度的变量被分为10组,那么需要设计的虚拟变量数目可以通过以下方法确定:

对于一个有 \( k \) 个类别的名目变量,通常需要 \( k-1 \) 个虚拟变量来表示。原因是使用 \( k-1 \) 个虚拟变量可以唯一地表示所有 \( k \) 个类别,而不需要冗余信息。具体来说,可以通过 \( k-1 \) 个虚拟变量的组合来表示第 \( k \) 个类别。

因此,如果名目尺度的变量被分为10组,则需要设计的虚拟变量数为 \( 10-1=9 \)。

所以,正确答案是:B: 9

专业分析:
1. **名目变量的定义**:名目变量是指那些没有内在顺序的分类变量,例如颜色(红、蓝、绿)、性别(男、女)等。
2. **虚拟变量的设计**:虚拟变量是二进制(0或1)的变量,用于表示名目变量的不同类别。每个虚拟变量表示一个类别是否存在。
3. **虚拟变量的数量**:对于一个有 \( k \) 个类别的名目变量,使用 \( k-1 \) 个虚拟变量就可以唯一地表示所有类别。这是因为第 \( k \) 个类别可以通过所有虚拟变量都为0来表示,从而避免了多重共线性问题。

例如:
- 如果名目变量有3个类别(A, B, C),则需要2个虚拟变量:
- \( D1 \): A=1, B=0, C=0
- \( D2 \): A=0, B=1, C=0
- 如果 \( D1 \) 和 \( D2 \) 都为0,则表示类别C。

按照这个逻辑,如果名目变量有10个类别,则需要9个虚拟变量来表示。