统计式分词的优缺点:优点:• 能够处理大多数常用词带来的歧义问题 • 在训练语料规模足够大和覆盖领域足够多的情况下,可以获得较高的切分正确率 (>=95%) 缺点:• 不能处理新词以及新词带来的歧义问题 • 需要很大的训练语料 • 分词速度相对较慢
正确答案是:D: 不能够处理大多数常用词带来的歧义问题。
以下是对各选项的专业分析:
A: 不能处理新词以及新词带来的歧义问题
统计式分词依赖于已有的训练语料和统计模型,对于未在训练语料中出现的新词,分词效果较差,容易产生错误分词和歧义。
B: 需要很大的训练语料
统计式分词需要大量的训练语料来构建统计模型,以提高分词的准确性和覆盖率,因此对训练数据的需求较大。
C: 分词速度相对较慢
由于统计式分词需要进行大量的概率计算和匹配操作,分词速度相对基于规则的分词方法较慢。
D: 不能够处理大多数常用词带来的歧义问题
这是错误的说法。统计式分词在处理常用词的歧义问题上通常表现较好,因为常用词在训练语料中频繁出现,统计模型能够较好地捕捉它们的上下文信息,从而减少歧义。
综上所述,选项D是错误的。