长文本关键词提取后,进行可视化,Python完整代码示例,直接写代码
时间: 2023-12-27 19:02:24 浏览: 60
好的,以下是一个基于Python的长文本关键词提取并进行可视化的完整代码示例:
```python
# 导入所需的库
from jieba import analyse
from wordcloud import WordCloud
import matplotlib.pyplot as plt
# 读取文本文件
with open('text.txt', 'r', encoding='utf-8') as f:
text = f.read()
# 使用jieba库提取关键词
keywords = analyse.extract_tags(text, topK=50, withWeight=True, allowPOS=('n', 'nz', 'v', 'vd', 'vn', 'l', 'a', 'd'))
# 将关键词和权重拆分为两个列表
words = []
weights = []
for keyword, weight in keywords:
words.append(keyword)
weights.append(weight)
# 使用WordCloud库生成词云图
wordcloud = WordCloud(font_path='simhei.ttf', background_color='white').generate_from_frequencies(dict(zip(words, weights)))
# 可视化词云图
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis('off')
plt.show()
```
这段代码将读取名为`text.txt`的文本文件,并使用jieba库提取其中的50个关键词及其权重。然后,它将这些关键词和权重拆分为两个列表,并使用WordCloud库生成词云图。最后,使用Matplotlib库将词云图可视化。
阅读全文