考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

某信贷机构用逻辑回归建立了一个用于客户违约的信用评分模型,模型的参数估计和检验信息如下: (4)一般来说,如果名目尺度的变量被分为10组,则需要设计的虚拟变量数为?
A. 8
B. 9
C. 10
D. 无法确定
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

将虚拟变量放入回归中,一定要少放一个虚拟变量,否则系统会提示存在多重 共线性问题。故本题选B

在统计和回归分析中,名目尺度(即分类变量)通常需要转换为虚拟变量(dummy variables)以便在模型中使用。假设名目尺度的变量有 \( k \) 个类别,那么通常需要 \( k-1 \) 个虚拟变量来表示这些类别。原因是使用 \( k-1 \) 个虚拟变量可以避免多重共线性问题,并且能够唯一地表示每一个类别。

具体来说,如果名目尺度的变量被分为 10 组,则需要设计的虚拟变量数为 \( 10-1 = 9 \) 个。

因此,正确答案是:B: 9。

### 专业分析
1. **名目尺度变量**:名目尺度变量是指那些分类变量,它们的类别没有天然的顺序。例如,颜色(红、蓝、绿)或地区(东、西、南、北)。

2. **虚拟变量**:虚拟变量是一种二进制(0或1)变量,用于表示分类变量的不同类别。每个虚拟变量代表一个类别,值为1表示属于该类别,值为0表示不属于该类别。

3. **避免多重共线性**:如果我们有 \( k \) 个类别,并且使用 \( k \) 个虚拟变量,那么这些虚拟变量之间会存在完全的线性关系(即它们的总和总是等于1),这会导致多重共线性问题。因此,我们通常使用 \( k-1 \) 个虚拟变量。

4. **示例**:假设我们有一个名目尺度变量“地区”,有4个类别:东、西、南、北。我们可以用3个虚拟变量来表示:
- \( D1 \) 表示是否为东
- \( D2 \) 表示是否为西
- \( D3 \) 表示是否为南

如果一个观测值属于“北”,那么 \( D1, D2, D3 \) 都为0。

综上所述,名目尺度变量被分为10组时,需要设计9个虚拟变量。