用jupyter完成淄博高质量创新型城市建设文件的词云
时间: 2023-08-04 15:13:58 浏览: 92
首先,需要安装以下依赖库:
- jieba
- wordcloud
- matplotlib
可以使用以下命令进行安装:
```
!pip install jieba wordcloud matplotlib
```
接下来,需要读取淄博高质量创新型城市建设文件的文本内容,并使用 jieba 进行分词。代码如下:
```python
import jieba
# 读取文件内容
with open('淄博高质量创新型城市建设文件.txt', 'r', encoding='utf-8') as f:
text = f.read()
# 分词
words = jieba.cut(text)
```
然后,使用 wordcloud 生成词云。代码如下:
```python
from wordcloud import WordCloud
import matplotlib.pyplot as plt
# 统计词频
word_freq = {}
for word in words:
if len(word) > 1:
word_freq[word] = word_freq.get(word, 0) + 1
# 生成词云
wordcloud = WordCloud(font_path='msyh.ttc', background_color='white')
wordcloud.generate_from_frequencies(word_freq)
# 显示词云
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis('off')
plt.show()
```
其中,`font_path` 参数指定字体文件路径,`background_color` 参数指定背景色。
最后,将生成的词云保存为图片。代码如下:
```python
wordcloud.to_file('淄博高质量创新型城市建设文件词云.png')
```
完整代码如下:
```python
import jieba
from wordcloud import WordCloud
import matplotlib.pyplot as plt
# 读取文件内容
with open('淄博高质量创新型城市建设文件.txt', 'r', encoding='utf-8') as f:
text = f.read()
# 分词
words = jieba.cut(text)
# 统计词频
word_freq = {}
for word in words:
if len(word) > 1:
word_freq[word] = word_freq.get(word, 0) + 1
# 生成词云
wordcloud = WordCloud(font_path='msyh.ttc', background_color='white')
wordcloud.generate_from_frequencies(word_freq)
# 显示词云
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis('off')
plt.show()
# 保存词云
wordcloud.to_file('淄博高质量创新型城市建设文件词云.png')
```
阅读全文