python输出词云图高频词前五十
时间: 2023-09-30 14:06:22 浏览: 70
用Python做中文分词和绘制词云图
个怎么实现?
可以使用Python中的wordcloud库和jieba库来实现。首先需要对文本进行分词处理,然后统计每个词出现的频率,最后根据频率生成词云图。下面是一个简单的示例代码:
```python
import jieba
from wordcloud import WordCloud
text = "这是一段文本,用于生成词云图。"
# 对文本进行分词处理
words = jieba.lcut(text)
# 统计每个词出现的次数
word_counts = {}
for word in words:
if len(word) == 1:
continue
word_counts[word] = word_counts.get(word, 0) + 1
# 按照词频排序
word_counts = sorted(word_counts.items(), key=lambda x: x[1], reverse=True)
# 取出前50个高频词
high_freq_words = dict(word_counts[:50])
# 生成词云图
wc = WordCloud(width=800, height=400, background_color='white', font_path='msyh.ttc')
wc.generate_from_frequencies(high_freq_words)
wc.to_file('wordcloud.png')
```
这段代码可以生成一个名为wordcloud.png的词云图,其中显示了出现频率最高的前50个词。
阅读全文