正确答案是 B: 命名实体识别。
命名实体识别(Named Entity Recognition,简称NER)是自然语言处理中的一项重要任务,旨在识别和分类文本中的命名实体,如人名、地名、组织名、日期等。其目的是从非结构化的文本数据中提取结构化的信息。
以下是对各选项的专业分析:
A: 文本分类
文本分类是将文本分配到预定义的类别中。例如,将新闻文章分类为体育、政治、娱乐等类别。它关注的是整体文本的类别而不是具体词的类别。
B: 命名实体识别
命名实体识别专注于识别文本中的特定词或词组,并将其分类为预定义的实体类别,如人名、地名、组织名等。这项任务的目标是从文本中抽取有意义的实体信息。
C: 语义角色标注
语义角色标注(Semantic Role Labeling,SRL)是识别句子中的谓词-论元结构,即确定句子中各个成分的语义角色,如施事、受事、工具等。它更多关注的是句子成分在事件中的角色,而不是简单的实体识别。
D: 词性标注
词性标注(Part-of-Speech Tagging,POS Tagging)是给文本中的每个词分配一个词性标签,如名词、动词、形容词等。它关注的是词语的语法功能,而不是其具体类别。
综上所述,命名实体识别(NER)是确定文本中的哪些词表示特定类别(如人名、地名)的任务,因此正确答案是 B: 命名实体识别。