大数据分析师考试重点：MLlib特点-CDA考试官方模拟题库

备考刷题，请到

CDA认证小程序

对MLlib的特点论述错误的是（）

A. A 运算速度快，适用于具有较多迭代次数的算法

B. B 具有易用性，RDD中封装了大量的操作，提供了经典机器学习算法的API

C. C 集成度高，能够与Spark上的其他组件进行无缝对接

D. D 运行原理是将Spark程序转换为MapReduce程序运行，并行度高

上一题

下一题

题目解析

题目评论(0)

正确答案是 D: 运行原理是将Spark程序转换为MapReduce程序运行，并行度高。

分析：
- A: 运算速度快，适用于具有较多迭代次数的算法。这是正确的。MLlib是构建在Spark之上的分布式机器学习库，利用内存计算加速迭代过程，相比于传统的MapReduce，迭代速度更快。

- B: 具有易用性，RDD中封装了大量的操作，提供了经典机器学习算法的API。这也是正确的。MLlib提供了易于使用的API，支持多种经典的机器学习算法，并且与Spark的RDD紧密集成，使得数据处理和机器学习建模更加方便。

- C: 集成度高，能够与Spark上的其他组件进行无缝对接。这是正确的。MLlib可以与Spark的其他组件（如Spark SQL、Spark Streaming等）无缝集成，方便进行数据处理和实时分析。

- D: 运行原理是将Spark程序转换为MapReduce程序运行，并行度高。这是错误的。Spark并不是通过将程序转换为MapReduce来运行的。相反，Spark有自己独立的计算模型，主要依赖于内存计算和DAG（有向无环图）调度机制，与MapReduce不同。Spark的并行度高是因为它的内存计算和任务调度机制，而不是通过MapReduce实现的。