用python统计《三国演义》人物出场统计 ,并制作词云(源程序、运行结果截图)
时间: 2024-10-25 20:05:22 浏览: 164
在Python中,我们可以使用`jieba`库进行分词处理,`collections`库统计词频,然后结合`wordcloud`库生成词云图。这里提供一种基本步骤:
首先,你需要有一个包含《三国演义》文本数据的文件,例如txt格式。如果没有现成的数据,可以先从网络上下载或手动输入。
```python
# 导入必要的库
import jieba
from collections import Counter
import matplotlib.pyplot as plt
from wordcloud import WordCloud
# 读取文本数据
with open('三国演义.txt', 'r', encoding='utf-8') as file:
text = file.read()
# 使用jieba进行分词
words = jieba.lcut(text)
# 统计词频
word_counts = Counter(words)
# 提取最常见的n个单词(可以根据需要调整n)
top_words = word_counts.most_common(100)
# 创建词云对象
wordcloud = WordCloud(font_path='simhei.ttf', width=800, height=600).generate_from_frequencies(dict(top_words))
# 显示和保存词云图
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")
plt.title('《三国演义》人物出场词云')
plt.savefig('三国演义词云.png')
plt.show()
```
注意,这个例子假设你已经有了一个名为'simhei.ttf'的中文字体文件,如果没有,需要自行下载或者替换为你本地的字体路径。另外,如果你的数据不是英文版,可能需要调整jieba的分词规则。
阅读全文