什么是TF-IDF?
时间: 2023-12-24 18:24:19 浏览: 63
TF-IDF:用Wikipedia所有语料所计算出来的TF-IDF自动化脚本,未来为变成django app放在实验室的api上供大家query
TF-IDF是一种用于评估一个词语在文档中重要程度的统计方法。它由词频(TF)和逆文档频率(IDF)两部分组成,其中词频指的是一个词在文档中出现的次数,逆文档频率指的是一个词在整个语料库中出现的频率的倒数。将这两个值相乘,就得到了一个词的TF-IDF值。某个词对文章的重要性越高,它的TF-IDF值就越大。因此,TF-IDF算法可以用于自动提取关键词,信息检索等领域。
阅读全文