考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

关于统计式分词的缺点,以下说法错误的是?
A. 不能处理新词以及新词带来的歧义问题
B. 需要很大的训练语料
C. 分词速度相对较慢
D. 不能够处理大多数常用词带来的歧义问题
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

统计式分词的优缺点:优点:• 能够处理大多数常用词带来的歧义问题 • 在训练语料规模足够大和覆盖领域足够多的情况下,可以获得较高的切分正确率 (>=95%) 缺点:• 不能处理新词以及新词带来的歧义问题 • 需要很大的训练语料 • 分词速度相对较慢

正确答案是:D: 不能够处理大多数常用词带来的歧义问题。

以下是对各选项的专业分析:

A: 不能处理新词以及新词带来的歧义问题
统计式分词依赖于已有的训练语料和统计模型,对于未在训练语料中出现的新词,分词效果较差,容易产生错误分词和歧义。

B: 需要很大的训练语料
统计式分词需要大量的训练语料来构建统计模型,以提高分词的准确性和覆盖率,因此对训练数据的需求较大。

C: 分词速度相对较慢
由于统计式分词需要进行大量的概率计算和匹配操作,分词速度相对基于规则的分词方法较慢。

D: 不能够处理大多数常用词带来的歧义问题
这是错误的说法。统计式分词在处理常用词的歧义问题上通常表现较好,因为常用词在训练语料中频繁出现,统计模型能够较好地捕捉它们的上下文信息,从而减少歧义。

综上所述,选项D是错误的。