字、词、词组、概念 (Single Term or Phrase Term)或N-Gram都是文本语意的抽取层次的单位
正确答案是:B: 词
专业分析:
文本语意的抽取层次可以有多种单位,例如字、词、词组和N-Gram等。然而,从自然语言处理的角度来看,词是最基本且最常用的语义单位。以下是对各选项的分析:
A: 字
字是最小的语言单位,但单个字通常无法独立表达完整的语义。在中文中,许多词汇由多个字符组成,因此以字为单位的语义抽取往往不够精确。
B: 词
词是语义最基本的单位,能够独立表达特定的意义。在许多自然语言处理任务中,如分词、词性标注、命名实体识别等,词是最常用的基本单位。
C: 词组
词组是由多个词组成的短语,能够表达更复杂的语义。然而,词组的粒度较大,处理起来复杂度较高,且在许多情况下,直接以词为单位可以满足大部分需求。
D: N-Gram
N-Gram是指由N个连续的词组成的序列,用于捕捉上下文信息。虽然N-Gram在一些特定任务中非常有用,但它们的主要用途是捕捉词与词之间的关系,而不是作为基本的语义单位。
综上所述,词是文本语意抽取中最基本且最常用的单位,因此正确答案是B: 词。