考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

假设需要对某个数据集使用mahout进行聚类,数据集共有6类数据,需要迭代7次,拟使用mahout进行聚类,假设输入文件为input/part-m-0000,输出目录为output,初始聚类中心点文件路径为clusters,下列聚类语句正确的是( )
A. mahout kmenas -i input/part-m-0000 -o output -c clusters - k 6 -x 7
B. mahout kmenas -i input/part-m-0000 -o output -c clusters - k 7 -x 6
C. mahout kmenas -i input/part-m-0000 -o output -c clusters -x 6
D. mahout kmenas -i input/part-m-0000 -o output -c clusters - k 7
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

在对数据集进行聚类时,使用 Mahout 的 `kmeans` 命令所需的参数解释如下:

- `-i`:指定输入文件路径。
- `-o`:指定输出目录。
- `-c`:指定初始聚类中心点文件路径。
- `-k`:指定聚类的类别数量。
- `-x`:指定最大迭代次数。

题目要求:
- 聚类类别数量 `k` 应为 6。
- 迭代次数 `x` 应为 7。

分析选项:

- **A: `mahout kmenas -i input/part-m-0000 -o output -c clusters - k 6 -x 7`**
- 符合要求,其中 `k 6` 是类别数量,`x 7` 是迭代次数。

- **B: `mahout kmenas -i input/part-m-0000 -o output -c clusters - k 7 -x 6`**
- 这选项不符合要求,因为 `k` 为 7,且 `x` 为 6。

- **C: `mahout kmenas -i input/part-m-0000 -o output -c clusters -x 6`**
- 缺少 `-k` 参数,未指定类别数量。

- **D: `mahout kmenas -i input/part-m-0000 -o output -c clusters - k 7`**
- 缺少 `-x` 参数,且 `k` 为 7,不符合要求。

综上所述,选项 A 是正确的聚类语句。