考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术。tf-idf中的tf和idf分别代表了什么含义?
A. 逆词频对数
B. 词频
C. 词向量
D. 逆文本频率指数
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

tf代表词频,idf代表逆文本频率指数

TF-IDF(term frequency–inverse document frequency)是一种常用的加权技术,用于信息检索和数据挖掘。它主要用于评估一个词语对于一个文档集或一个语料库中的一个文档的重要程度。

在TF-IDF中,TF和IDF分别代表:
- TF(Term Frequency):词频,表示某一个词语在单个文档中出现的次数。选项B是正确的。
- IDF(Inverse Document Frequency):逆文档频率指数,表示某一个词语在整个文档集中的普遍重要性。IDF的计算公式通常为IDF(t) = log(N / (1 + df(t))),其中N是文档集中的文档总数,df(t)是包含词语t的文档数。选项D是正确的。

因此,TF-IDF中的TF和IDF分别代表词频和逆文档频率指数。正确答案是B和D。