python爬取制作词云图
时间: 2023-09-21 07:10:23 浏览: 104
python生成词云图
5星 · 资源好评率100%
制作词云图需要使用到两个库:`jieba`和`wordcloud`。
首先需要安装这两个库,可以在命令行中输入以下命令进行安装:
```
pip install jieba
pip install wordcloud
```
然后就可以开始编写Python代码了。假设我们要制作的词云图数据来源于一个文本文件`text.txt`,以下是一个简单的代码示例:
```python
import jieba
from wordcloud import WordCloud
import matplotlib.pyplot as plt
# 读取文本文件
with open('text.txt', 'r', encoding='utf-8') as f:
text = f.read()
# 使用jieba分词
words = jieba.lcut(text)
# 将分词结果转换为以空格分隔的字符串
text = ' '.join(words)
# 生成词云图
wc = WordCloud(background_color="white", width=1000, height=600, font_path='msyh.ttc')
wc.generate(text)
# 显示词云图
plt.imshow(wc)
plt.axis("off")
plt.show()
```
以上代码中,`jieba.lcut`函数将文本进行分词,并返回一个列表,列表中的每个元素都是一个分好的词语。`' '.join(words)`将分词后的列表转换为以空格分隔的字符串,用于生成词云图。`WordCloud`类用于生成词云图,可以设置词云图的背景颜色、宽度、高度和字体。最后调用`plt.imshow(wc)`和`plt.show()`显示词云图。
需要注意的是,由于词云图需要根据词语的频率来生成,因此在生成之前需要对文本进行处理,例如去除停用词、数字、标点符号等。此外,还可以根据需求对分词结果进行进一步的筛选和处理。
阅读全文