考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

假设有句子"他说的确实在理",对这句话进行分词。 (1)中文分词是NLP任务中重要的一步,如果对“他说的确实在理”利用结巴进行全切分,其的结果为?
A. {他,说,的确,确实,实在,理}
B. {他,说,的,确实,在理}
C. {他,说,的确,实在,理}
D. {他,说,的确,实,在理}
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

全切分:获得文本所有可能的切分结果。所以选A。

正确答案是 B: {他,说,的,确实,在理}。

分析如下:

中文分词是自然语言处理(NLP)中的基础任务之一,其目的是将连续的汉字序列切分成单独的词语。结巴分词(Jieba)是一种常用的中文分词工具,它可以对中文文本进行精确的切分。

对于句子“他说的确实在理”,利用结巴分词进行全切分时,结巴分词会尽量切分出常见的词语和短语,因此其结果为:

- "他":代词
- "说":动词
- "的":助词
- "确实":副词,表示肯定
- "在理":短语,表示有道理

所以,结巴分词的结果是 {他,说,的,确实,在理},对应选项 B。