用python jieba对文章进行词频统计并绘制词云图
时间: 2023-07-04 20:07:58 浏览: 162
基于Python实现对Word文档的文本分词,词频统计输出,以及绘制词云图.zip
5星 · 资源好评率100%
好的,以下是用 Python 的 jieba 和 wordcloud 库进行词频统计和绘制词云图的代码示例:
```python
import jieba
from wordcloud import WordCloud
import matplotlib.pyplot as plt
# 读取文本文件
with open('article.txt', 'r', encoding='utf-8') as f:
text = f.read()
# 使用 jieba 分词
words = jieba.lcut(text)
# 统计词频
freq = {}
for word in words:
if word in freq:
freq[word] += 1
else:
freq[word] = 1
# 生成词云图
wc = WordCloud(background_color='white', width=800, height=600, margin=2)
wc.generate_from_frequencies(freq)
plt.imshow(wc)
plt.axis('off')
plt.show()
```
其中,`article.txt` 是要处理的文本文件,需要放在与代码同一目录下。这段代码会先使用 jieba 分词,然后统计每个词出现的次数。最后,使用 wordcloud 库生成词云图并显示出来。你可以根据需要调整词云图的参数,如背景颜色、大小等,以及 jieba 分词的方式和停用词等。
阅读全文