考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

假设词典中包括词{的确,王公,实在,在理,公子}以及所有单字集合,请分别给出句子“王公子说的确实在理”的FMM和BMM分词结果。 (2)BMM分词结果为?
A. 王公/子/说/的确/实在/理
B. 王/公子/说/的/确实/在理
C. 王公子/说/的/确实/在理
D. 王公子/说的/确实/在理
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

BMM即反向(从右向左扫描)最大匹配分词,每次从句尾向前读取maxWordLength个字,如若匹配则继续,否则去掉最左侧单字继续匹配,直至单字无法匹配,将其单独分词。从后往前,这里先出现公子,后出现王公,所以选B。

为了回答这个问题,我们需要了解FMM(正向最大匹配法)和BMM(逆向最大匹配法)这两种分词算法的基本原理。

1. **FMM(正向最大匹配法)**:从左到右扫描句子,每次取最大长度的词进行匹配。
2. **BMM(逆向最大匹配法)**:从右到左扫描句子,每次取最大长度的词进行匹配。

给定词典:{的确,王公,实在,在理,公子}以及所有单字集合。

### FMM分词结果
从左到右扫描句子“王公子说的确实在理”:
1. "王公子"(最大匹配词)
2. "说"(单字)
3. "的确"(最大匹配词)
4. "实在"(最大匹配词)
5. "理"(单字)

FMM分词结果为:“王公子/说/的确/实在/理”。

### BMM分词结果
从右到左扫描句子“王公子说的确实在理”:
1. "在理"(最大匹配词)
2. "确实"(最大匹配词)
3. "的"(单字)
4. "说"(单字)
5. "王公子"(最大匹配词)

BMM分词结果为:“王公子/说/的/确实/在理”。

### 正确答案
根据上述分析,BMM分词结果为“王公子/说/的/确实/在理”,所以正确答案是:
C: 王公子/说/的/确实/在理

### 专业分析
FMM和BMM都是常用的分词算法,各有优缺点。FMM倾向于从左到右进行匹配,可能会在某些情况下造成误分词;BMM则从右到左进行匹配,能在某些情况下弥补FMM的不足。通过结合两种方法的结果,可以更准确地进行中文分词。

希望这个分析对您有所帮助!