CDA数据分析师

CDA数据分析师

考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

多一份专注 努力便多一分回报 | LEVEL Ⅱ 持证人分享

2022-03-18


朱晓晨 LEVEL Ⅱ 持证人

 

我目前在一家央企的省公司,担任大数据工程师。工作中会使用大数据生态圈的一些框架来做数据处理和分析。

 

开始想报考数据分析方向的认证,在了解相关的认证考试后,感觉CDA和本职工作相关,而且认证有一定的共识性,对职业发展有一定帮助,所以选择报考CDA LEVEL Ⅱ 大数据方向的认证考试。


01 周末集中时间备考

根据知识点查漏补缺

 

我平时从事相关的开发工作,所以对大数据生态圈中的一些组件和框架也都比较熟悉。

 

我在考前一个月进行备考,周末每天3-4小时备考,主要是查缺补漏。包括:HadoopSparkHiveMysqlSqoop组件的搭建和配置。Spark数据挖掘的分析步骤,代码实践。HadoopSparkHBase等组件底层原理的学习。这里的几个框架组件在案例题实操中需要用到,自己搭建一遍有助于复习框架底层原理。

 

如果是基础弱的话,建议提前2-3个月备考。并且需要熟悉:

Linux命令

SQL语句

一门编程语言。建议JavaPythonScala

大数据基础理论。谷歌的三篇论文原理,GFSBigTableMapReduce

大数据生态圈组件学习,重点在HadoopSparkHive

 

理论方面,如果没有大数据基础的同学以谷歌的三篇论文为主,而大数据的相关框架是基于这三篇论文实现的。包括HDFSHBaseMapReduce原理;此外还有Spark的原理。

实践方面,要会搭建,维护大数据集群。Spark的应用要熟练。

根据例题,大纲,查缺补漏。

去了解主流的一些大数据架构和解决方案,了解大数据生态圈中每个组件的功能,哪些用于数据处理,哪些用于数据存储,哪些用于数据传输。

 

在备考的时候以大纲和例题为主。大数据分析师重点在大数据组件的应用,其次再是机器学习,统计分析等内容。

 

在备考书籍方面,我个人推荐以下基本:

 

Hadoop权威指南》:了解和熟悉HDFSYarnMapReduce原理。

Spark快速大数据分析》:熟悉RDDDataFrame算子操作,MLlib应用。

Hive编程指南》:对Hive快速上手非常有用。

《数据挖掘导论》:如果对数据挖掘,机器学习感兴趣的话是一本很好的书。

 

备考中,个人感觉这些知识是难点:

框架运行机制

机器学习算法

SparkHive开发调优

 

之后我也将继续学习大数据生态,了解各行各业的业务知识,在大数据架构和分析两方面进一步提升。



预告

第十二届CDA认证优秀考生直播经验分享

敬请期待哦!



完 谢谢观看