首页西游记文本词频统计，词云图的制作代码

西游记文本词频统计，词云图的制作代码

时间: 2024-03-14 20:46:55 浏览: 25

以下是一个简单的实现文本词频统计和词云图制作的Python代码，你可以根据需要进行修改： ```python # 导入需要的库 import jieba from wordcloud import WordCloud from collections import Counter from PIL import Image import numpy as np # 读取文本文件 with open('西游记.txt', 'r', encoding='utf-8') as f: content = f.read() # 使用jieba分词 words = jieba.cut(content) # 统计词频 word_counts = Counter(words) # 生成词云图 mask = np.array(Image.open('yuanbao.jpg')) # 词云图形状 wordcloud = WordCloud( font_path='msyh.ttc', # 字体文件路径 background_color='white', # 背景颜色 mask=mask, # 词云图形状 width=800, height=600 # 图片大小 ) wordcloud.generate_from_frequencies(word_counts) # 保存词云图 wordcloud.to_file('wordcloud.png') ``` 其中，'西游记.txt'是要统计词频的文本文件路径，'yuanbao.jpg'是词云图形状的图片文件路径，'msyh.ttc'是使用的字体文件路径。生成的词云图将保存在'wordcloud.png'文件中。你可以根据需要修改这些参数。