考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

假设词典中包括词{的确,王公,实在,在理,公子}以及所有单字集合,请分别给出句子“王公子说的确实在理”的FMM和BMM分词结果。 (1)FMM分词结果为?
A. 王公/子/说/的确/实在/理
B. 王/公子/说/的/确实/在理
C. 王公子/说/的/确实/在理
D. 王公子/说的/确实/在理
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

FMM即正向(从左向右扫描)最大匹配分词,即每次向后读取maxWordLength个字,如若匹配则继续,否则回退一个字继续匹配,直至单字无法匹配,将其单独分词。从前往后,这里先出现王公,后出现公子,所以选A。

(1)FMM分词结果为?。A: 王公/子/说/的确/实在/理 B:王/公子/说/的/确实/在理 C:王公子/说/的/确实/在理 D: 王公子/说的/确实/在理,请给出正确答案并做出专业分析

正确答案是:C: 王公子/说/的/确实/在理

专业分析:

FMM(Forward Maximum Matching)算法,也称为正向最大匹配法,是从左到右扫描句子,并尽可能匹配最长的词。

1. 从左到右扫描句子“王公子说的确实在理”。
2. 首先从句子开始部分尝试匹配最长的词“王公子”,在词典中找到匹配,因此分割为“王公子”。
3. 接着继续扫描“说”,在词典中找到匹配,因此分割为“说”。
4. 然后扫描“的”,在词典中找到匹配,因此分割为“的”。
5. 接着扫描“确实”,在词典中找到匹配,因此分割为“确实”。
6. 最后扫描“在理”,在词典中找到匹配,因此分割为“在理”。

因此,FMM分词结果为:王公子/说/的/确实/在理

选项C正确。