根据给定的《三国演义》或者其他的文本,将词频为前15的词语打印输出,并通过词云的方式展示出来。
时间: 2024-04-29 20:26:20 浏览: 33
好的,根据您的要求,我可以为您提供以下代码,以实现您的需求:
```python
import jieba
from collections import Counter
from wordcloud import WordCloud
import matplotlib.pyplot as plt
# 读取文本内容
with open('三国演义.txt', 'r', encoding='utf-8') as f:
text = f.read()
# 对文本进行分词
words = jieba.cut(text)
# 统计词频并输出前15的词语
word_counts = Counter(words)
top_words = word_counts.most_common(15)
for word, count in top_words:
print(word, count)
# 生成词云图片
wordcloud = WordCloud(background_color='white', font_path='simhei.ttf')
wordcloud.generate_from_frequencies(word_counts)
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis('off')
plt.show()
```
在上述代码中,我们先读取了《三国演义》的文本内容,然后使用jieba库对其进行分词,并通过collections.Counter类统计了词频信息。接着,我们按照词频从高到低排序,输出了前15个词语。最后,使用wordcloud库生成了词云图片,并在Matplotlib中展示出来。
需要注意的是,您需要将代码中的文本文件路径修改为您所使用的文本文件路径。同时,您可能需要安装jieba、wordcloud和Matplotlib这些库,才能运行上述代码。
阅读全文