新用户注册
备考刷题,请到
CDA认证小程序
正确答案是:C: 文本数据集。 专业分析:大语言模型(LLM,Large Language Model)通常基于大量的文本数据集进行训练。这些模型需要理解和生成自然语言,因此需要大量的文本数据来学习语言的结构、语法、语义以及上下文关系。文本数据集可以包括书籍、文章、网页内容、对话记录等各种形式的文字信息。通过在这些数据上进行训练,LLM能够掌握语言的各种特性,从而在自然语言处理任务中表现出色。视频、图像和音频数据集通常用于训练其他类型的模型,例如计算机视觉模型和语音识别模型,而不是语言模型。