python水浒传词频统计生成词云图
时间: 2023-12-23 11:28:03 浏览: 297
以下是使用Python进行水浒传词频统计并生成词云图的示例代码:
```python
import jieba
from wordcloud import WordCloud
import matplotlib.pyplot as plt
# 读取文本文件
with open('./su/水浒.txt', 'r', encoding='utf-8') as f:
text = f.read()
# 使用jieba进行分词
words = jieba.cut(text)
# 统计词频
word_freq = {}
for word in words:
if word not in word_freq:
word_freq[word] = 1
else:
word_freq[word] += 1
# 生成词云图
wordcloud = WordCloud(font_path='simhei.ttf', width=800, height=400, background_color='white').generate_from_frequencies(word_freq)
# 显示词云图
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis('off')
plt.show()
```
这段代码首先使用`jieba`库对文本进行分词,然后统计每个词出现的频率。接下来,使用`wordcloud`库生成词云图,并使用`matplotlib`库显示词云图。
请注意,你需要提前安装`jieba`、`wordcloud`和`matplotlib`库,并将字体文件`simhei.ttf`放在代码所在目录下。
阅读全文