考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

在研究“不同营销渠道对销售额的影响”时,变量“营销渠道”是一个分类变量,包含三个类别:{社交媒体, 搜索引擎, 电子邮件}。在构建线性回归模型时,正确的处理方式是:
A. 直接赋值为1, 2, 3代入模型
B. 创建2个哑变量(Dummy Variables),以其中一个类别作为参照组
C. 创建3个虚拟变量,全部放入模型中
D. 将该变量剔除,因为线性回归只能处理连续变量
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

对于有 k 个类别的分类变量,需要创建 k-1 个虚拟变量,并保留一个类别作为基准(参照组),以避免“虚拟变量陷阱”(完全多重共线性例如 DA+DB+DC=1,DC=1-DA-DB)。如果赋值1,2,3(A选项),会错误地暗示类别之间存在数值大小和等距的顺序关系。