长文本关键词提取后,进行可视化,Python代码示例
时间: 2024-02-16 20:28:57 浏览: 82
以下是使用Python中的gensim和wordcloud库对长文本进行关键词提取和可视化的示例代码:
```python
import matplotlib.pyplot as plt
from wordcloud import WordCloud
from gensim.summarization import keywords
# 读取文本文件
with open('text_file.txt', 'r', encoding='utf-8') as f:
text = f.read()
# 提取关键词
kw = keywords(text, ratio=0.2, lemmatize=True)
# 生成词云
wordcloud = WordCloud(width=800, height=400, background_color='white').generate(kw)
# 显示词云
plt.figure(figsize=(12, 10))
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis('off')
plt.show()
```
解释:
1. 首先使用`open()`函数读取文本文件,将其保存为一个字符串`text`。
2. 接着使用`keywords()`函数从文本中提取关键词,其中`ratio`参数指定提取关键词的比例,`lemmatize=True`表示对关键词进行词形还原。
3. 使用`WordCloud()`函数生成词云,其中`width`和`height`参数分别指定词云的宽度和高度,`background_color`参数指定词云的背景颜色。
4. 最后使用`imshow()`函数显示词云,并使用`axis('off')`函数去除坐标轴。
注:在运行代码前请确保已安装好所需的库。
阅读全文