python代码实现:用TF-IDF算法提取关键词,并输出结果到txt文件
时间: 2024-03-03 18:50:11 浏览: 362
python实现TF-IDF算法提取关键词
下面是用python实现用TF-IDF算法提取关键词,并将结果输出到txt文件的示例代码:
```python
import jieba.analyse
# 读取文本内容
with open('text.txt', 'r', encoding='utf-8') as f:
content = f.read()
# 提取关键词,设置关键词数量为10
keywords = jieba.analyse.extract_tags(content, topK=10, withWeight=True)
# 将关键词及权重输出到txt文件
with open('keywords.txt', 'w', encoding='utf-8') as f:
for keyword, weight in keywords:
f.write('{} {}\n'.format(keyword, weight))
```
解释:
1. 首先通过`jieba.analyse`模块提取关键词,其中`extract_tags`函数的第一个参数为待提取关键词的文本内容,第二个参数`topK`表示要提取的关键词数量,第三个参数`withWeight`表示是否输出关键词的权重。
2. 接着将提取出的关键词及其权重输出到txt文件中,其中`write`函数用于写入文本内容,`format`函数用于格式化输出文本内容。
3. `with`语句用于打开文件并自动关闭文件,可以有效避免因忘记关闭文件而造成的资源浪费或文件损坏等问题。
需要注意的是,在运行代码前需要先安装jieba模块,可以通过以下命令进行安装:
```
pip install jieba
```
阅读全文