考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术。tf-idf中的tf和idf分别代表了什么含义?
A. 逆词频对数
B. 词频
C. 词向量
D. 逆文本频率指数
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

tf代表词频,idf代表逆文本频率指数

TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术。它主要用于评估一个词语在一篇文档中的重要程度。

TF(Term Frequency)表示词频,衡量一个词在一篇文档中出现的频率。通常,词频可以通过以下公式计算:
\[ \text{TF}(t,d) = \frac{\text{词语} \ t \ \text{在文档} \ d \ \text{中出现的次数}}{\text{文档} \ d \ \text{中的词语总数}} \]

IDF(Inverse Document Frequency)表示逆文档频率,衡量一个词在整个语料库中的普遍重要性。其计算公式如下:
\[ \text{IDF}(t,D) = \log \left( \frac{N}{|\{d \in D : t \in d\}|} \right) \]
其中,\( N \) 是文档总数,\( |\{d \in D : t \in d\}| \) 是包含词语 \( t \) 的文档数。

结合起来,TF-IDF的计算公式为:
\[ \text{TF-IDF}(t,d,D) = \text{TF}(t,d) \times \text{IDF}(t,D) \]

根据以上分析,TF 和 IDF 分别代表:
- TF:词频
- IDF:逆文档频率

因此,正确答案是:
B: 词频