考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

假设词典中包括词{的确,王公,实在,在理,公子}以及所有单字集合,请分别给出句子“王公子说的确实在理”的FMM和BMM分词结果。 (1)FMM分词结果为?
A. 王公/子/说/的确/实在/理
B. 王/公子/说/的/确实/在理
C. 王公子/说/的/确实/在理
D. 王公子/说的/确实/在理
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

FMM即正向(从左向右扫描)最大匹配分词,即每次向后读取maxWordLength个字,如若匹配则继续,否则回退一个字继续匹配,直至单字无法匹配,将其单独分词。从前往后,这里先出现王公,后出现公子,所以选A。

FMM(正向最大匹配法)是从左到右进行词语匹配的分词方法。根据提供的词典{的确,王公,实在,在理,公子},我们可以逐步进行词语匹配。

句子是“王公子说的确实在理”,我们从左到右进行匹配:

1. 首先匹配到“王公子”,在词典中找不到“王公子”这个词,所以继续分解。
2. 匹配到“王公”,在词典中存在“王公”这个词。
3. 剩下的部分是“子说的确实在理”。
4. 匹配到“子”,在词典中存在“子”这个词。
5. 剩下的部分是“说的确实在理”。
6. 匹配到“说”,在词典中没有“说”这个词,所以继续分解。
7. 匹配到“的确”,在词典中存在“的确”这个词。
8. 剩下的部分是“实在理”。
9. 匹配到“实在”,在词典中存在“实在”这个词。
10. 剩下的部分是“理”,在词典中没有“理”这个词,所以继续分解。

最终FMM分词结果为:王公/子/说/的确/实在/理。

所以,正确答案是:A: 王公/子/说/的确/实在/理。

专业分析:
FMM方法从左到右逐字匹配,优先匹配最长的词语。在这个过程中,分词结果依赖于词典中词语的存在与否。每一步都尽量匹配最长的词语,直到无法匹配为止。