CDA数据分析师

CDA数据分析师

考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

CDA LEVEL II 第十二届考试优秀考生采访

2022-03-18

第十二届CDA认证考试,在2020726日圆满地落下了帷幕,本次考试在全国23所城市共设立37个考场。

 

近日,我们采访了在本届考试中名列前茅的几位优秀学员,并在本文中整理了他们的备考和学习经验,希望备考者们能够有所参考,并取得理想的成绩。

 

今天为大家带来的是,在CDA认证考试 Level II中取得优异成绩的几位考生。下面让我们来一睹他们的风采吧!


CDA LEVEL II 大数据方向-优秀考生

第一名 卢竹林

1.报考CDA认证考试的契机


目前主要在学校从事信息化工作,目前学校越来越重视大数据在教学、管理方面的应用,所以信息化的工作方面会用到比较多的数据分析的思维和技能。


系统梳理知识疏漏,不是为了考试而考试

 

我报考了今年7LEVEL  Ⅱ 大数据方向的CDA认证考试,主要是想系统的学习整个数据专业方面的知识结构和工作技能。通过考试,督促自己的加强相关知识和技能方面的学习和应用。CDA认证考试算是目前为数不多,在数据技能专业方向的认证,在是市场有一定认可程度。

 

因为一开始报名考试,就不是为了考试,所以从报名到考试,并没有完全针对考试进行复习,只是根据考试大纲要求的知识,整理自己需要学习相关专业数据,自己找书和看在线教程,关注相关行业的公众号。

 

一方面系统的梳理自己知识的疏漏;另一方面有意识在工作中应用相关技能。

 

2.我是如何备考的


报名到考试有大半年,受疫情影响倒是有很多时间在家学习相关知识。备考时间说长也长,说短也短。并不算完全为考试去准备。


对知识进行查漏补缺,自己跑一跑相关实例

 

3.备考中有哪些知识难点


备考中,我觉得具体的难点在以下几点:

 

整个大数据架构,涉及的软件很多,所有软件自己安装调试,在家跑书中实例一遍,需要踩过很多坑,因为没有培训和指导,主要是考网上和书本资料解决,整个架构中涉及软件版本等对接的确用了比较多的时间。

 

大数据相关实例的算法的理解和应用,特别底层原来需要用比较多少时间学习和理解,而且感觉理解的不够透彻,对考试可能问题不是很大,不过对实践中可能关系比较大。

 

主要是针对大纲,对知识进行查漏补缺,主要的相关数据分析实例自己跑一跑。

 

还是希望更加专业的数据专业知识,会报考LEVEL Ⅲ的考试。希望通过考试,结合自己工作,提高自己数据思维和工作层次。


CDA LEVEL II 大数据方向-优秀考生

第二名 朱晓晨

1.目前从事的工作


我目前在一家央企的省公司,担任大数据工程师。工作中会使用大数据生态圈的一些框架来做数据处理和分析。

 

2.报考CDA认证考试契机


开始想报考数据分析方向的认证,在了解相关的认证考试后,感觉CDA和本职工作相关,而且认证有一定的共识性,对职业发展有一定帮助,所以选择报考CDA LEVEL Ⅱ 大数据方向的认证考试。


周末集中时间备考,据知识点查漏补缺

 

我平时从事相关的开发工作,所以对大数据生态圈中的一些组件和框架也都比较熟悉。

 

3.我是如何备考的


我在考前一个月进行备考,周末每天3-4小时备考,主要是查缺补漏。包括:HadoopSparkHiveMysqlSqoop组件的搭建和配置。Spark数据挖掘的分析步骤,代码实践。HadoopSparkHBase等组件底层原理的学习。这里的几个框架组件在案例题实操中需要用到,自己搭建一遍有助于复习框架底层原理。

 

如果是基础弱的话,建议提前2-3个月备考。并且需要熟悉:

Linux命令

SQL语句

一门编程语言。建议JavaPythonScala

大数据基础理论。谷歌的三篇论文原理,GFSBigTableMapReduce

大数据生态圈组件学习,重点在HadoopSparkHive

 

理论方面,如果没有大数据基础的同学以谷歌的三篇论文为主,而大数据的相关框架是基于这三篇论文实现的。包括HDFSHBaseMapReduce原理;此外还有Spark的原理。

实践方面,要会搭建,维护大数据集群。Spark的应用要熟练。

根据例题,大纲,查缺补漏。

去了解主流的一些大数据架构和解决方案,了解大数据生态圈中每个组件的功能,哪些用于数据处理,哪些用于数据存储,哪些用于数据传输。

 

在备考的时候以大纲和例题为主。大数据分析师重点在大数据组件的应用,其次再是机器学习,统计分析等内容。

 

4.推荐的书籍和课程


在备考书籍方面,我个人推荐以下基本:

 

Hadoop权威指南》:了解和熟悉HDFSYarnMapReduce原理。

Spark快速大数据分析》:熟悉RDDDataFrame算子操作,MLlib应用。

Hive编程指南》:对Hive快速上手非常有用。

《数据挖掘导论》:如果对数据挖掘,机器学习感兴趣的话是一本很好的书。

 

5.备考中有哪些知识难点


备考中,个人感觉这些知识是难点:

框架运行机制

机器学习算法

SparkHive开发调优


 6.未来的职业发展规划


之后我也将继续学习大数据生态,了解各行各业的业务知识,在大数据架构和分析两方面进一步提升。


CDA LEVEL II 建模方向-优秀考生

第一名 张国成

1.目前从事的工作


目前我在通信运营商从事数字化转型方面的工作,主要负责客户经营、智慧营销所涉及的大数据分析、数据挖掘、标签建设等。

 

2.报考CDA认证考试的契机


在此非常感谢我的公司。2020年集团公司提出数字化转型战略,为接应数转要求,公司领导推荐我们报考大数据建模方面的社会认证,主要是想通过认证快速提升大数据技能,为公司培养数字化转型人才,我有幸作为公司首批成员报考了本次CDA考试。

 

3.我是如何备考的


案例操作题是难点,一定要做到心中有数

 

我之前从事大数据方面工作,有一定的知识域经验积累,因此本次备考时间不是很长,大概1个月时间左右。整个备考主要是围绕考试大纲来进行,利用下班后与周末的闲暇时间,进行阅读与实操。

 

在备考资料中,首推备考手册,一定是弄熟弄懂备考手册里的知识点,尤其是数学推算。

 

4.推荐的书籍和课程


如果基础比较薄弱的考生,建议购买下考试配套的视频课程,视频课程也是仅仅围绕大纲进行展开,但李老师讲的更加详细,李老师准备的python套件对考生以的案例操作题还是今后的工作实践都很有帮助。

 

至于书籍的话可以看看考试推荐的《数据挖掘:概念与技术》机械工业出版社,作为备考手册的补充。

 

5.备考中有哪些知识难点


考试中的难点我觉得还是案例操作题,客观题根据大纲来备考完全没有问题,考试题目完成在大纲范围内,但案例操作题不一样,案例题得分是根据预测结果的准确性高低进行排名打分,排名后25%将不得分,直接影响考试成败。

 

案例题考试时间仅仅2个小时,在这么短的时间内,对一份陌生的、混乱的数据进行清洗、分析与洞察,并取得良好的F1值,时间还是比较紧张的,因此要提前做好案例题的演练与准备,做到心中有数。

 

6.对备考者们的建议


对备考者的建议方面,我有以下几点:

 

关于客观题,考试手册里的知识点至少看三遍,确保要求掌握的知识点全部掌握,确保决策树的信息增益、gini值、贝叶斯概率、线性回归参数等计算会算。

案例题:要亲自实践,做好缺失值、异常值、归一化等常用的数据预处理方法,掌握一两个分类算法的调参方法。

对照模拟题,学会举一反三,融会贯通。

 

7.未来的职业发展规划


今后的职业发展规划,我打算从以下几点:

 

 一是学以致用,将参加认证考试所学的知识和技能用在生产实践中,为公司内部数字化转型贡献个人最大增益。

二是知识燎原,组织公司内部相关人员开展大数据学习,为企业培养储备更多的大数据转型人才。

三是强化学习,进一步提升自身技能,向Level III 数据科学家冲刺。


CDA LEVEL II 建模方向-优秀考生

第二名 马亮

1.目前从事的工作


我在一家电信运营商企业从事大数据建模和分析,平时的工作就是跟数据打交道,包括数据加工、数据分析、挖掘建模等,所以对数据分析比较熟悉。

 

2.报考CDA认证考试的契机


用考试检验水平,同时提升数据挖掘知识

 

我报考了今年7CDA Level Ⅱ 建模方向的考试。本身从事数据工作有几年了,这次报考一方面是想对自己在数据挖掘领域的知识再次梳理和提升,另一方面想通过社会认证检验自己的能力水平。

 

3.我是如何备考


我从5月底开始备考,整个过程大概有两个月的时间。

 

在前1个月是打基础阶段,我每天保证至少1个小时的学习时间(周末2-3个小时),主要是看视频,把老师所讲的知识点过一遍。

考前1个月的冲刺阶段,我每天保证至少2个小时的学习时间,主要是做模拟题和运行课程中老师提供的代码。

考前1周,准备实操题代码,把建模可能涉及到的代码都准备好。

 

4.备考中有哪些知识难点


我觉得理论考试中的计算题是难点,比如一开始我在计算条件概率的时候,一直没搞懂哪个是条件,后来通过反复做模拟题才理清楚。

 

实操题的难点是时间比较紧张,考试现场从无到有地徒手撸代码是不现实的,所以事先把相关代码准备好。另外心态要保持好,即使出现报错,也要放松,冷静查找可能的原因,不能自乱阵脚。

 

5.推荐的书籍和课程


数据方面,我推荐《机器学习实战:基于Scikit-LearnTensorFlow 》,这本书把常见的算法理论和建模的各个环节都掰开揉碎、细细道来,并且有大量的代码,实操性很强,可以说是理论和实践结合得非常好的一本书。

 

一定要坚持把视频看完,首先老师讲的很好,把一些艰深的理论通过浅显的方式做讲解,其次考试的时候,试卷上的考题基本上都在老师的课上出现过。

 

每天保证有充足的复习时间,备考CDA的同学很多都是已经工作的,本身工作很忙,所以需要适量压缩一部分的休息和娱乐时间。


 6.未来的职业发展规划


今后想在数据挖掘这个岗位上继续努力,提升自己在大数据平台方面的实操能力,同时多学习前沿知识,把更多的数据挖掘方法应用在工作中。



完 谢谢观看