考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

下面哪个是RDD的特点( )(多选)
A. 可分区
B. 可序列化
C. 可修改
D. 可持久化
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

RDD(Resilient Distributed Dataset)是Apache Spark中的一个核心抽象,用于表示一个不可变的分布式数据集。以下是对选项的分析:

A: 可分区
RDD是可分区的。这是RDD的一个重要特点,因为它允许数据在集群中的多个节点上分布和并行处理。分区是并行计算的基本单位。

B: 可序列化
RDD是可序列化的。为了在集群节点之间传输数据,RDD中的元素需要是可序列化的,以便通过网络进行传输。

C: 可修改
RDD是不可修改的。RDD是不可变的,一旦创建就不能被修改。任何对RDD的转换都会生成一个新的RDD,而不是修改现有的RDD。

D: 可持久化
RDD是可持久化的。用户可以选择将RDD持久化到内存或磁盘中,以便在后续的操作中重用,从而提高计算效率。

综上所述,正确答案是A: 可分区, B: 可序列化, D: 可持久化。