西游记文本词频统计,词云图的制作代码
时间: 2024-03-14 20:46:55 浏览: 25
以下是一个简单的实现文本词频统计和词云图制作的Python代码,你可以根据需要进行修改:
```python
# 导入需要的库
import jieba
from wordcloud import WordCloud
from collections import Counter
from PIL import Image
import numpy as np
# 读取文本文件
with open('西游记.txt', 'r', encoding='utf-8') as f:
content = f.read()
# 使用jieba分词
words = jieba.cut(content)
# 统计词频
word_counts = Counter(words)
# 生成词云图
mask = np.array(Image.open('yuanbao.jpg')) # 词云图形状
wordcloud = WordCloud(
font_path='msyh.ttc', # 字体文件路径
background_color='white', # 背景颜色
mask=mask, # 词云图形状
width=800, height=600 # 图片大小
)
wordcloud.generate_from_frequencies(word_counts)
# 保存词云图
wordcloud.to_file('wordcloud.png')
```
其中,'西游记.txt'是要统计词频的文本文件路径,'yuanbao.jpg'是词云图形状的图片文件路径,'msyh.ttc'是使用的字体文件路径。生成的词云图将保存在'wordcloud.png'文件中。你可以根据需要修改这些参数。