正确答案是:C: Spark采用MPP架构,并发处理。
分析:
A: Spark 支持DAG(有向无环图),这是Spark比Hadoop MapReduce更高效的一个重要原因。DAG允许更复杂的计算流程,可以优化执行计划,提高计算效率。
B: Spark中间数据不存储磁盘,进行缓存处理。Spark通过内存计算来提高速度,避免了Hadoop MapReduce频繁的磁盘读写操作,这显著提升了计算效率。
C: Spark采用MPP架构,并发处理。这并不是Spark比Hadoop MapReduce更高效的主要原因。MPP(大规模并行处理)是一种数据库技术,虽然Spark确实支持并行计算,但其高效性主要来自于其他特性。
D: 高度抽象API。Spark提供了高度抽象的API,如DataFrame和Dataset,这使得开发人员可以更简单高效地编写复杂的处理逻辑,提高了开发效率和程序执行效率。
因此,C选项不包含在Spark比Hadoop MapReduce更高效的主要原因中。