考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

以下文本特征向量化的方法中属于词嵌入模型的是?
A. One-Hot编码
B. TF-IDF模型
C. CBOW模型
D. 以上皆是
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

常用的词嵌入模型有CBOW、skip-gram、Glove等,A和B选项不是词嵌入

正确答案是 C: CBOW模型。

专业分析:
1. **One-Hot编码**:这种方法将每个词表示为一个高维向量,其中只有一个维度是1,其余维度都是0。这种方法并没有捕捉词与词之间的语义关系,因此不属于词嵌入模型。

2. **TF-IDF模型**:TF-IDF(Term Frequency-Inverse Document Frequency)是一种统计方法,用于评估一个词在一个文档集或语料库中的重要性。它通过计算词频和逆文档频率来衡量词的重要性,但它也没有捕捉词与词之间的语义关系,因此也不属于词嵌入模型。

3. **CBOW模型**:CBOW(Continuous Bag of Words)模型是一种词嵌入模型。它通过上下文词来预测中心词,学习得到词的低维稠密向量表示,这些向量能够捕捉词与词之间的语义关系。

综上所述,CBOW模型属于词嵌入模型,而One-Hot编码和TF-IDF模型不属于词嵌入模型。