RDD转换DataFrame的方法-CDA考试官方模拟题库

备考刷题，请到

CDA认证小程序

如何将rdd转换成DataFrame

A. rdd.toDF()

B. spark.createDataFrame()

C. spark.read()

D. spark.read_csv()

上一题

下一题

题目解析

题目评论(0)

正确答案是A: `rdd.toDF()` 和 B: `spark.createDataFrame()`。

以下是对每个选项的分析：

A: `rdd.toDF()`
这是一个直接的方法，可以将RDD转换为DataFrame。这个方法需要在RDD上调用，并且通常需要在调用之前导入适当的Spark SQL隐式转换（如`import spark.implicits._`），以便RDD能够使用`toDF()`方法。

B: `spark.createDataFrame()`
这是另一种将RDD转换为DataFrame的方法。`spark.createDataFrame()`可以接受一个RDD作为参数，并将其转换为DataFrame。这种方法更为通用，因为它允许你指定DataFrame的schema，从而提供更精确的控制。

C: `spark.read()`
这个选项不适用于将RDD转换为DataFrame。`spark.read()`用于读取外部数据源（如CSV、JSON、Parquet等）并创建DataFrame，而不是将RDD转换为DataFrame。

D: `spark.read_csv()`
这个选项也不适用于将RDD转换为DataFrame。`spark.read_csv()`是用于读取CSV文件并创建DataFrame的方法，而不是用于RDD转换。

因此，A和B是将RDD转换为DataFrame的正确方法。