考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

某大型连锁零售集团(以下简称“集团”)计划在2026年第二季度全面升级其会员管理体系,重点在于通过数据驱动实现“千人千面”的精准营销。集团数据分析师小王负责基于2025全年的会员交易数据进行探索性数据分析(EDA)与可视化报告撰写,以支持管理层制定新的积分兑换策略和商品推荐逻辑。 在分析过程中,小王遇到了以下关键场景与挑战: 1. 变量类型复杂:数据集包含会员的基础属性(如性别、会员等级、偏好品类)、行为数据(如最近一次消费时间、消费频率)以及财务数据(如客单价、年度总消费额、单次购物篮商品数量)。 2. 分布形态异常:初步统计发现,“年度总消费额”和“单次购物篮商品数量”呈现明显的右偏分布(长尾),大部分用户消费较低,但少数高净值用户拉高了均值;而“会员满意度指数”(连续型变量)则呈现双峰分布。 3. 多维关系探索:业务部门希望了解不同“会员等级”下的“平均客单价”差异,以及“年龄”与“年度总消费额”之间是否存在线性相关关系。 4. 制图规范需求:最终报告需要向非技术背景的高管展示,要求图表既能准确反映统计特征(如离散程度、偏态),又要直观易懂,避免误导。 作为该项目的数据分析师,你需要依据数据可视化与统计分析的相关原理,解决以下关键问题。 (1)小王首先需要对“会员等级”(普通、银卡、金卡、钻石)这一分类型变量进行描述性统计,以便了解各等级用户的规模占比。下列统计量中,最不适合用于描述该分类型变量集中趋势或分布特征的是?
A. 众数(Mode)
B. 频数与频率(Frequency & Relative Frequency)
C. 算术平均数(Mean)
D. 比例(Proportion)
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

“会员等级”属于定序分类型变量(Categorical/Ordinal)。对于分类型变量,常用的统计量包括众数(出现次数最多的类别)、频数、频率和比例。算术平均数(Mean)仅适用于连续型数值变量(或可量化的定距/定比变量),对“金卡”、“银卡”等标签直接求平均无数学意义(除非将其转化为数值编码,但原始定义下不适用)。故选C。