python基于tf-idf算法的关键词提取代码
时间: 2023-12-20 11:04:15 浏览: 121
使用Python和TF-IDF算法进行关键词提取
下面是基于tf-idf算法的关键词提取代码:
```python
import jieba
import jieba.analyse
# 加载停用词表
jieba.analyse.set_stop_words("stopwords.txt")
# 读取文本文件
with open("text.txt", "r", encoding="utf-8") as f:
text = f.read()
# 使用jieba进行分词,获取关键词
keywords = jieba.analyse.extract_tags(text, topK=10, withWeight=True)
# 输出关键词及其权重
for keyword, weight in keywords:
print(keyword, weight)
```
其中,stopwords.txt是停用词表文件,可以使用自己的停用词表文件替换。text.txt是需要提取关键词的文本文件,可以使用自己的文本文件替换。topK参数表示要提取的关键词数量,withWeight参数表示是否输出关键词的权重。
阅读全文