2023-07-12
给你一张E-R图,它由3张表组成,据此你能分析出哪些业务指标?请详述你的分析思路。
解析:将常见的一些业务分析指标,还原成数据表的基础字段,通俗的说就是知道如何将表中的基本字段进行计算后得到一些分析指标,是数据分析师的基本功。
知识点1:
E-R图即实体-联系图(Entity Relationship Diagram),是指提供了表示实体型、属性和联系的方法,用来描述现实世界的概念模型。E-R方法:是“实体-联系方法”(Entity-Relationship Approach)的简称。它是描述现实世界概念结构模型的有效方法。从3张表的表间关系、表名、字段名等特征来看,这应该是记录了零售行业,或者电商行业的一个简单的业务信息。作为零售行业,应关注如下指标:
按省、市维度分析:销量、销售额,可以从总数分析、也可以从最大值(单笔订单)分析。在省、市维度中,可以各省汇总排名、各市汇总排名、省内各市汇总排名等。非常灵活,看实际分析需求。
知识点2:去重计数
在orderinfo表中计算下单人数的时候,要注意对userid进行去重计数,因为一个用户可以多次下单。
知识点3:多表连接
(1)计算下单用户中,性别比例问题要用userinfo和orderinfo两表连接,可以用内连接,也可以用左/右连接切记以orderinfo为主表(保证未下单的用户排除掉)。
(2)在按区域为维度进行分析时,必须将orderinfo与regioninfo进行两次连接,从而得到省名称、市名称。此时要注意两点:
- 连接后的select子句中避免出现重复字段,导致后面的二次查询报错。
- 在与regionname进行连接的时候,可以用内连接,也可以用左连接(orderinfo表为主表),一定要给regioninfo表设置表别名。将orderinfo与regioninfo两次表连接,得到基础表的宽表,后面查询可在此基础上操作,示例如下:
Select orderinfo.*, 省表.regionname as 省, 市表.regionname as 市
from orderinfo
left join regioninfo as 省表 on province=省表.regionid
left join regioninfo as 市表 on city=市表.regionid
完 谢谢观看
CDA认证
关于CDA考试 最新考试安排 考试报名入口 CDA证书查询CDA合作
CDA教育 CDMS Pearson CVA协会关注CDA
关于我们 Email:exam@cdaglobal.com 电 话:010-68454276 微 信:15311595173