考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

Spark比Hadoop的MR计算高效,主要原因不包含下面__
A. Spark 支持DAG
B. Spark中间数据不存储磁盘,进行缓存处理
C. Spark采用MPP架构,并发处理
D. 高度抽象API
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

正确答案是:C: Spark采用MPP架构,并发处理。

分析:

A: Spark 支持DAG(有向无环图),这是Spark比Hadoop MapReduce更高效的一个重要原因。DAG允许更复杂的计算流程,可以优化执行计划,提高计算效率。

B: Spark中间数据不存储磁盘,进行缓存处理。Spark通过内存计算来提高速度,避免了Hadoop MapReduce频繁的磁盘读写操作,这显著提升了计算效率。

C: Spark采用MPP架构,并发处理。这并不是Spark比Hadoop MapReduce更高效的主要原因。MPP(大规模并行处理)是一种数据库技术,虽然Spark确实支持并行计算,但其高效性主要来自于其他特性。

D: 高度抽象API。Spark提供了高度抽象的API,如DataFrame和Dataset,这使得开发人员可以更简单高效地编写复杂的处理逻辑,提高了开发效率和程序执行效率。

因此,C选项不包含在Spark比Hadoop MapReduce更高效的主要原因中。