Spark数据分析高效性考察-CDA考试官方模拟题库

备考刷题，请到

CDA认证小程序

Spark比Hadoop的MR计算高效，主要原因不包含下面__

A. Spark 支持DAG

B. Spark中间数据不存储磁盘，进行缓存处理

C. Spark采用MPP架构，并发处理

D. 高度抽象API

上一题

下一题

题目解析

题目评论(0)

正确答案是：C: Spark采用MPP架构，并发处理。

分析：

A: Spark 支持DAG（有向无环图），这是Spark比Hadoop MapReduce更高效的一个重要原因。DAG允许更复杂的计算流程，可以优化执行计划，提高计算效率。

B: Spark中间数据不存储磁盘，进行缓存处理。Spark通过内存计算来提高速度，避免了Hadoop MapReduce频繁的磁盘读写操作，这显著提升了计算效率。

C: Spark采用MPP架构，并发处理。这并不是Spark比Hadoop MapReduce更高效的主要原因。MPP（大规模并行处理）是一种数据库技术，虽然Spark确实支持并行计算，但其高效性主要来自于其他特性。

D: 高度抽象API。Spark提供了高度抽象的API，如DataFrame和Dataset，这使得开发人员可以更简单高效地编写复杂的处理逻辑，提高了开发效率和程序执行效率。

因此，C选项不包含在Spark比Hadoop MapReduce更高效的主要原因中。