考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

某大型连锁零售企业(以下简称“企业”)在2025年实施了全新的“全渠道会员营销策略”。为了评估该策略对不同区域门店销售额的实际影响,并探究“营销投入”与“销售转化”之间的量化关系,总部数据科学团队提取了2025年全年旗下120家门店的经营数据。 数据分析师小王负责利用统计学方法对数据进行深入挖掘,主要涉及以下四个核心分析目标: 1.策略有效性验证:对比实施新策略的“实验组门店”与未实施的“对照组门店”在第四季度的人均客单价是否存在显著差异。 2.区域差异分析:考察“华东、华北、华南、华西”四大区域的季度总销售额是否存在显著不同,以判断是否需要差异化资源配置。 3.驱动因素建模:构建模型量化“广告投入金额”、“促销活动次数”对“月度销售额”的线性影响程度,并检验模型的总体显著性。 4.用户流失预测:基于会员的“登录频率”、“历史消费额”和“投诉次数”,预测用户在下一季度是否会“流失”(二分类变量:是/否)。 5.方差齐性检验:在进行多区域对比前,必须确认各区域销售数据的方差是否满足同质性假设,以决定后续采用何种具体的检验统计量。 作为该项目的数据分析师,你需要依据统计分析原理(假设检验、方差分析、回归分析等),解决以下关键问题。 (4)针对“用户流失预测”任务,因变量“是否流失”是二分类变量(0=未流失,1=流失)。小王发现如果使用线性回归模型,预测值出现了大于1或小于0的情况,且残差明显不服从正态分布。此时,最恰当的建模方法是?
A. 多项式回归(Polynomial Regression)
B. 逻辑回归(Logistic Regression)
C. 岭回归(Ridge Regression)
D. 主成分回归(PCR)
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

A选项:多项式回归仍属于线性回归范畴,输出值是连续实数,无法限制在[0,1]区间内,不适合概率预测或分类。 B选项:逻辑回归专门用于处理因变量为二分类(或多分类)的问题。它通过Sigmoid函数将线性组合映射到(0,1)区间,输出的是事件发生的概率,完美解决了预测值越界和残差非正态的问题。 C选项:岭回归是线性回归的一种正则化形式,主要用于解决多重共线性,输出依然是连续值,不适用于分类问题。 D选项:主成分回归用于降维和处理共线性,同样输出连续值。 故选B。