考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

对于MLlib中向量与LabledPoint,以下描述正确的是( )(多选)
A. LabledPoint是一种基于向量扩展得到的数据结构
B. 向量既可以是本地的也可以是分布式的
C. MLlib中既可以定义稀疏向量也可以定义密集向量
D. 在LabledPoint中除了包含一个向量成员外,还包含一个Double类型的标识成员
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

在MLlib中,向量和LabeledPoint是用于表示数据的基本结构。我们来分析每个选项:

A: LabeledPoint是一种基于向量扩展得到的数据结构
这个描述是正确的。LabeledPoint是一个数据结构,用于存储机器学习算法中的标记数据。它包含一个标签(通常是一个Double类型的数值)和一个特征向量(可以是密集的或稀疏的)。

B: 向量既可以是本地的也可以是分布式的
这个描述不准确。在MLlib中,向量(Vector)本身是一个本地的数据结构,用于在单个节点上表示数据。MLlib中的向量类有DenseVector和SparseVector,它们都是本地向量。分布式数据结构通常是RDD(Resilient Distributed Dataset)或DataFrame,这些可以在集群上分布式存储和处理。

C: MLlib中既可以定义稀疏向量也可以定义密集向量
这个描述是正确的。MLlib提供了DenseVector(密集向量)和SparseVector(稀疏向量)两种类型,用于表示不同类型的特征向量。密集向量存储所有的元素,而稀疏向量只存储非零元素及其索引,以节省空间。

D: 在LabeledPoint中除了包含一个向量成员外,还包含一个Double类型的标识成员
这个描述是正确的。LabeledPoint由一个标签(label)和一个特征向量(features)组成。标签通常是一个Double类型的数值,用于表示样本的类别或目标值。

因此,正确的答案是A、C和D。