考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

如何将rdd转换成DataFrame
A. rdd.toDF()
B. spark.createDataFrame()
C. spark.read()
D. spark.read_csv()
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

正确答案是A: `rdd.toDF()` 和 B: `spark.createDataFrame()`。

以下是对每个选项的分析:

A: `rdd.toDF()`
这是一个直接的方法,可以将RDD转换为DataFrame。这个方法需要在RDD上调用,并且通常需要在调用之前导入适当的Spark SQL隐式转换(如`import spark.implicits._`),以便RDD能够使用`toDF()`方法。

B: `spark.createDataFrame()`
这是另一种将RDD转换为DataFrame的方法。`spark.createDataFrame()`可以接受一个RDD作为参数,并将其转换为DataFrame。这种方法更为通用,因为它允许你指定DataFrame的schema,从而提供更精确的控制。

C: `spark.read()`
这个选项不适用于将RDD转换为DataFrame。`spark.read()`用于读取外部数据源(如CSV、JSON、Parquet等)并创建DataFrame,而不是将RDD转换为DataFrame。

D: `spark.read_csv()`
这个选项也不适用于将RDD转换为DataFrame。`spark.read_csv()`是用于读取CSV文件并创建DataFrame的方法,而不是用于RDD转换。

因此,A和B是将RDD转换为DataFrame的正确方法。