考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

MapReduce是Hadoop原生分布式计算框架,其本质上是一个离线的批处理计算框架,下列场景哪个是MapReduce适合处理的( )
A. 实时微博热词监控
B. 实时更新社交网络监控
C. 实时反欺诈监控
D. 在历史记录中,计算特定词汇出现词频
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

正确答案是:D: 在历史记录中,计算特定词汇出现词频。

分析:
MapReduce是Hadoop生态系统中的一种分布式计算框架,主要用于处理大规模数据集的批处理任务。它的设计初衷是为了高效地处理大量数据的离线分析任务,而不是实时处理任务。以下是对选项的分析:

A: 实时微博热词监控 - 这需要实时处理和分析数据,而MapReduce由于其批处理的特性和较高的延迟,不适合实时监控任务。

B: 实时更新社交网络监控 - 类似于选项A,这也需要实时数据处理和快速响应,而MapReduce不适合这种实时更新的场景。

C: 实时反欺诈监控 - 实时反欺诈需要快速检测和响应潜在的欺诈行为,通常需要低延迟的处理能力,MapReduce不适合这种需求。

D: 在历史记录中,计算特定词汇出现词频 - 这是一个典型的批处理任务,适合使用MapReduce。MapReduce可以高效地处理大规模的历史数据集来计算词频,因为它擅长将任务分解为Map和Reduce步骤,适合处理这种离线分析的场景。

综上所述,MapReduce更适合用于处理D选项中的批处理任务,而不是实时处理任务。