文本分类tfidf得到结果举例
时间: 2023-11-20 13:16:09 浏览: 116
文本分类结果
假设我们有一个由三个文本组成的语料库,分别为:
文本1: "The quick brown fox jumps over the lazy dog"
文本2: "A quick brown dog outpaces a quick fox"
文本3: "The quick brown fox is not as quick as the brown dog"
我们可以使用TF-IDF来提取文本特征,得到以下的TF-IDF向量表示:
文本1: [0.5, 0.0, 0.0, 0.0, 0.0, 0.5, 0.5, 0.0, 0.5]
文本2: [0.4, 0.5, 0.5, 0.0, 0.5, 0.0, 0.0, 0.5, 0.0]
文本3: [0.5, 0.0, 0.0, 0.5, 0.0, 0.5, 0.5, 0.0, 0.0]
其中,每个向量的长度为语料库中单词的总数,每个元素表示对应的单词在文本中的TF-IDF值。例如,第一个向量中的第一个元素表示单词"The"在文本1中的TF-IDF值。
阅读全文