2022-11-05
朱晓晨 LEVEL Ⅱ 持证人
我目前在一家央企的省公司,担任大数据工程师。工作中会使用大数据生态圈的一些框架来做数据处理和分析。
开始想报考数据分析方向的认证,在了解相关的认证考试后,感觉CDA和本职工作相关,而且认证有一定的共识性,对职业发展有一定帮助,所以选择报考CDA LEVEL Ⅱ 大数据方向的认证考试。
01 周末集中时间备考
根据知识点查漏补缺
我平时从事相关的开发工作,所以对大数据生态圈中的一些组件和框架也都比较熟悉。
我在考前一个月进行备考,周末每天3-4小时备考,主要是查缺补漏。包括:Hadoop,Spark,Hive,Mysql,Sqoop组件的搭建和配置。Spark数据挖掘的分析步骤,代码实践。Hadoop,Spark,HBase等组件底层原理的学习。这里的几个框架组件在案例题实操中需要用到,自己搭建一遍有助于复习框架底层原理。
如果是基础弱的话,建议提前2-3个月备考。并且需要熟悉:
Linux命令
SQL语句
一门编程语言。建议Java,Python或Scala。
大数据基础理论。谷歌的三篇论文原理,GFS,BigTable,MapReduce
大数据生态圈组件学习,重点在Hadoop,Spark,Hive
理论方面,如果没有大数据基础的同学以谷歌的三篇论文为主,而大数据的相关框架是基于这三篇论文实现的。包括HDFS,HBase,MapReduce原理;此外还有Spark的原理。
实践方面,要会搭建,维护大数据集群。Spark的应用要熟练。
根据例题,大纲,查缺补漏。
去了解主流的一些大数据架构和解决方案,了解大数据生态圈中每个组件的功能,哪些用于数据处理,哪些用于数据存储,哪些用于数据传输。
在备考的时候以大纲和例题为主。大数据分析师重点在大数据组件的应用,其次再是机器学习,统计分析等内容。
在备考书籍方面,我个人推荐以下基本:
《Hadoop权威指南》:了解和熟悉HDFS,Yarn,MapReduce原理。
《Spark快速大数据分析》:熟悉RDD,DataFrame算子操作,MLlib应用。
《Hive编程指南》:对Hive快速上手非常有用。
《数据挖掘导论》:如果对数据挖掘,机器学习感兴趣的话是一本很好的书。
备考中,个人感觉这些知识是难点:
框架运行机制
机器学习算法
Spark、Hive开发调优
之后我也将继续学习大数据生态,了解各行各业的业务知识,在大数据架构和分析两方面进一步提升。
预告
第十二届CDA认证优秀考生直播经验分享
敬请期待哦!
完 谢谢观看
CDA认证
关于CDA考试 最新考试安排 考试报名入口 CDA证书查询CDA合作
CDA教育 CDMS Pearson CVA协会关注CDA
关于我们 Email:exam@cdaglobal.com 电 话:010-68454276 微 信:15311595173