python去除停用词词云图
时间: 2023-06-21 22:14:47 浏览: 133
好的,首先需要导入一些必要的库:
```python
import jieba
from wordcloud import WordCloud
import matplotlib.pyplot as plt
```
接下来,我们需要定义停用词列表。这里我以中文停用词为例:
```python
stopwords = ['的', '在', '了', '是', '和', '有', '不', '也', '就是', '这个', '这些', '这种', '还是', '但是', '然而', '虽然', '因为', '所以', '如果', '与', '或者', '一些', '一般', '例如', '如此', '等等']
```
然后读取要生成词云图的文本,进行分词并去除停用词:
```python
text = open('text.txt', 'r', encoding='utf-8').read() # 读取文本文件
words = jieba.cut(text) # 对文本进行分词
words = [word for word in words if word not in stopwords] # 去除停用词
```
最后,我们可以根据分词结果生成词云图:
```python
wordcloud = WordCloud(font_path='msyh.ttc', width=800, height=600, background_color='white').generate(' '.join(words))
plt.imshow(wordcloud) # 显示词云图
plt.axis('off') # 关闭坐标轴
plt.show() # 显示图像
```
这里的 `font_path` 参数指定了字体文件路径,可以根据需要进行修改。`width` 和 `height` 参数指定了生成的词云图的尺寸,`background_color` 参数指定了背景颜色。
阅读全文