考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

你是一家银行的数据分析师,你的任务是使用现有的客户数据(data)来预测客户是否会违约。数据集data包括以下变量:年龄(Age)、收入(Income)、信用评分(Credit Score)、负债(Debt)和是否违约(Default)。根据以上任务完成以下问题。 假设现已导入库:import statsmodels.formula.api as smf,根据以上导入库的结果建立逻辑回归模型的步骤如下: - formula='是否违约(Default)~年龄(Age)+收入(Income)+信用评分(Credit Score)+负债(Debt)' - model = smf.logit() - model = model.fit(formula, data) - model.summary() 关于以上步骤中存在的问题说法正确的是()
A. 以上建模步骤完全正确
B. 以上建模步骤中,因变量和自变量的位置应该互换
C. 以上建模步骤中,没有写出回归系数
D. 以上建模步骤中,model.fit(formula, data)中的参数formula, data应该去掉,并将其加入到smf.logit()中,即smf.logit(formula, data)
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

在使用statsmodels建立逻辑回归模型时,公式和建模所需的数据应该设置在模型实例化的过程中,即smf.logit(formula, data)

答案:D

专业分析:

在使用 `statsmodels` 库进行逻辑回归模型建模时,步骤应该如下:

1. 确定公式(formula):
```python
formula = 'Default ~ Age + Income + Credit_Score + Debt'
```

2. 使用 `smf.logit` 函数来创建模型:
```python
model = smf.logit(formula, data)
```

3. 拟合模型:
```python
result = model.fit()
```

4. 查看模型摘要:
```python
result.summary()
```

根据以上步骤,选项D正确,因为 `smf.logit` 函数应该直接接受公式和数据作为参数,而不是在 `.fit()` 方法中传递。具体来说,应该是 `smf.logit(formula, data)` 而不是 `model.fit(formula, data)`。