利用jieba库 wordcloud词频统计
时间: 2023-11-11 10:02:34 浏览: 89
首先需要安装jieba和wordcloud库,在终端输入以下命令:
```
pip install jieba
pip install wordcloud
```
接下来我们来看一个简单的示例:
```python
import jieba
from wordcloud import WordCloud
# 读取文本文件
with open('text.txt', 'r', encoding='utf-8') as f:
text = f.read()
# 对文本进行分词
words = jieba.cut(text)
# 将分词结果组成字符串
content = ' '.join(words)
# 生成WordCloud对象
wc = WordCloud(background_color='white', width=800, height=600)
# 生成词云图像
wc.generate(content)
# 将词云图像保存到文件
wc.to_file('wordcloud.png')
```
这个示例中,我们首先使用jieba库对文本进行分词,然后将分词结果组成一个字符串。接着,我们使用WordCloud类生成一个词云图像,并将其保存到文件中。
如果要统计词频,可以使用Python的collections库。示例如下:
```python
import jieba
from collections import Counter
# 读取文本文件
with open('text.txt', 'r', encoding='utf-8') as f:
text = f.read()
# 对文本进行分词
words = jieba.cut(text)
# 统计词频
counter = Counter(words)
# 打印前10个出现频率最高的词
for word, count in counter.most_common(10):
print(word, count)
```
这个示例中,我们使用Counter类统计分词结果中每个词出现的次数,并打印出现频率最高的前10个词。
阅读全文