python用词频制作词云图
时间: 2023-08-26 11:17:24 浏览: 120
制作Python词云图的重要一步是将文本中的单词转换为单词频率,这个可以使用Python中的collections库中的Counter函数来实现。下面是一个简单的示例代码,展示如何使用词频制作词云图:
```
import jieba
from collections import Counter
from wordcloud import WordCloud
# 读取文本
with open('text.txt', 'r', encoding='utf-8') as f:
text = f.read()
# 分词
words = jieba.cut(text)
# 去除停用词
stopwords = set(['的', '是', '我', '你', '他', '她', '我们', '你们', '他们'])
filtered_words = [word for word in words if word not in stopwords]
# 统计词频
word_count = Counter(filtered_words)
# 制作词云
wc = WordCloud(font_path='msyh.ttc', width=800, height=600)
wc.generate_from_frequencies(word_count)
# 保存词云图
wc.to_file('wordcloud.png')
```
代码中,通过使用jieba库对文本进行分词,并使用collections库中的Counter函数统计每个词出现的次数。接着,使用WordCloud库生成词云图,其中的generate_from_frequencies()函数接受一个字典,字典的键表示单词,字典的值表示单词出现的次数,根据单词出现的次数设置单词的大小,最后将生成的词云图保存到本地。
阅读全文