考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

某大型连锁零售集团(以下简称“集团”)计划在2026年第二季度全面升级其会员管理体系,重点在于通过数据驱动实现“千人千面”的精准营销。集团数据分析师小王负责基于2025全年的会员交易数据进行探索性数据分析(EDA)与可视化报告撰写,以支持管理层制定新的积分兑换策略和商品推荐逻辑。 在分析过程中,小王遇到了以下关键场景与挑战: 1. 变量类型复杂:数据集包含会员的基础属性(如性别、会员等级、偏好品类)、行为数据(如最近一次消费时间、消费频率)以及财务数据(如客单价、年度总消费额、单次购物篮商品数量)。 2. 分布形态异常:初步统计发现,“年度总消费额”和“单次购物篮商品数量”呈现明显的右偏分布(长尾),大部分用户消费较低,但少数高净值用户拉高了均值;而“会员满意度指数”(连续型变量)则呈现双峰分布。 3. 多维关系探索:业务部门希望了解不同“会员等级”下的“平均客单价”差异,以及“年龄”与“年度总消费额”之间是否存在线性相关关系。 4. 制图规范需求:最终报告需要向非技术背景的高管展示,要求图表既能准确反映统计特征(如离散程度、偏态),又要直观易懂,避免误导。 作为该项目的数据分析师,你需要依据数据可视化与统计分析的相关原理,解决以下关键问题。 (5)在最终的统计制图中,小王需要展示“会员满意度指数”的分布形态,特别是其“双峰”特征(即满意和不满意的两极人群较多,中间人群较少)。为了精确呈现数据的分布形状、偏态和峰态,下列哪种图形加工与展示方式最为恰当?
A. 使用带有数据标签的条形图,仅展示各指数的频数
B. 使用核密度估计图(KDE Plot)叠加直方图,并调整带宽以平滑曲线
C. 使用折线图连接各指数的频数点
D. 使用气泡图,气泡大小代表频数
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

条形图(A)和折线图(C)虽然能展示频数,但对于连续或准连续变量的“分布形态”(如双峰、偏态、峰度)的直观感知不如密度曲线强烈,且难以体现概率密度的连续变化趋势。 气泡图(D)通常用于三维数据展示,不适合展示单变量分布。 核密度估计图(KDE Plot)能够平滑地展示数据的概率密度分布,叠加在直方图上可以极好地揭示分布的模态(如双峰)、偏度和峰度,是探索数据分布形态的高级可视化手段。故选B。