考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

某大型连锁零售企业(以下简称“企业”)在2025年实施了全新的“全渠道会员营销策略”。为了评估该策略对不同区域门店销售额的实际影响,并探究“营销投入”与“销售转化”之间的量化关系,总部数据科学团队提取了2025年全年旗下120家门店的经营数据。 数据分析师小王负责利用统计学方法对数据进行深入挖掘,主要涉及以下四个核心分析目标: 1.策略有效性验证:对比实施新策略的“实验组门店”与未实施的“对照组门店”在第四季度的人均客单价是否存在显著差异。 2.区域差异分析:考察“华东、华北、华南、华西”四大区域的季度总销售额是否存在显著不同,以判断是否需要差异化资源配置。 3.驱动因素建模:构建模型量化“广告投入金额”、“促销活动次数”对“月度销售额”的线性影响程度,并检验模型的总体显著性。 4.用户流失预测:基于会员的“登录频率”、“历史消费额”和“投诉次数”,预测用户在下一季度是否会“流失”(二分类变量:是/否)。 5.方差齐性检验:在进行多区域对比前,必须确认各区域销售数据的方差是否满足同质性假设,以决定后续采用何种具体的检验统计量。 作为该项目的数据分析师,你需要依据统计分析原理(假设检验、方差分析、回归分析等),解决以下关键问题。 (5)在完成多区域销售额的方差分析(ANOVA)后,F检验结果显示P<0.05,表明至少有一组区域与其他组存在显著差异。为了具体找出是哪两个区域之间存在差异(例如:华东是否显著高于华北),小王需要进行后续分析。下列做法符合统计学规范的是?
A. 直接观察各组均值,差值最大的两组即为显著不同
B. 对6组可能的两两组合分别进行独立的t检验,不使用任何校正
C. 使用事后检验(Post-hoc Test),如Tukey's HSD或Bonferroni校正
D. 重新运行一次回归分析,将区域作为连续变量处理
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

A选项错误:均值差异大不代表统计显著,必须考虑样本量和方差,需经过统计检验。 B选项错误:进行多次两两t检验而不校正,会使得整体犯第一类错误的概率(Family-wise error rate)远超设定的α水平(例如做6次检验,出错概率可能高达20%-30%),这是严重的统计谬误。 C选项正确:当ANOVA整体显著后,必须使用专门的事后检验(Post-hoc tests)。Tukey's HSD(Honestly Significant Difference)适用于所有组两两比较且样本量相近的情况;Bonferroni校正则通过调整显著性水平来控制多重比较误差。这是标准的分析流程。 D选项错误:区域是分类变量(名义变量),不能作为连续变量放入回归,且这不能直接解决两两比较的问题。 故选C。