jieba关键词提取
时间: 2024-03-23 17:32:53 浏览: 70
jieba是一个中文分词库,同时也提供了关键词提取的功能。下面是两个示例:
1.使用TF-IDF算法提取关键词
```python
import jieba.analyse
import jieba
jieba.load_userdict('自定义词典.txt') # 加载自定义词典
jieba.analyse.set_stop_words('停用词库.txt') # 去除自定义停用词
text = '大唐不夜城,不夜城趣味性很高,里面地方特色东西好吃,也有星巴克麦当劳等等选择,有不少场表演,外景夜景一定要薅一个,其它地方很难有这般景象了。娱乐体验了不倒翁,还有十二时辰里面表演更加精彩、内景拍照不错,簋唐楼可以尝试一下沉浸剧本杀……'
# 使用TF-IDF算法提取关键词,不需要进行分词,直接将原始文本传入
keywords = jieba.analyse.extract_tags(text, topK=20) # 默认输出前20个关键词,数值可自行修改
print(keywords)
```
2.只提取名词关键词
```python
import jieba.analyse
import jieba
jieba.load_userdict('自定义词典.txt') # 加载自定义词典
jieba.analyse.set_stop_words('停用词库.txt') # 去除自定义停用词
text = '大唐不夜城,不夜城趣味性很高,里面地方特色东西好吃,也有星巴克麦当劳等等选择,有不少场表演,外景夜景一定要薅一个,其它地方很难有这般景象了。娱乐体验了不倒翁,还有十二时辰里面表演更加精彩、内景拍照不错,簋唐楼可以尝试一下沉浸剧本杀……'
# 只提取名词关键词
keywords = jieba.analyse.extract_tags(text, topK=20, allowPOS=['n'])
print(keywords)
```
阅读全文