python123词云生成
时间: 2023-10-14 15:28:32 浏览: 144
词云生成,Python
要生成词云,需要使用Python中的第三方库wordcloud。首先需要使用pip安装该库,命令如下:
```
pip install wordcloud
```
接下来,需要准备一份文本数据,并使用Python读取该文本数据。假设我们有一份名为text.txt的文本文件,可以使用以下代码读取该文本文件:
```
with open('text.txt', 'r', encoding='utf-8') as f:
text = f.read()
```
接着,需要对文本数据进行预处理,包括去除停用词、分词等操作。这里可以使用中文分词库jieba来进行分词,如下所示:
```
import jieba
from wordcloud import WordCloud
# 加载停用词表
stopwords = [line.strip() for line in open('stopwords.txt', 'r', encoding='utf-8').readlines()]
# 分词并去除停用词
wordlist = jieba.cut(text)
wordlist = [word for word in wordlist if word not in stopwords]
# 生成词云
wordcloud = WordCloud(font_path='simhei.ttf', background_color='white', max_words=200).generate(' '.join(wordlist))
# 显示词云
import matplotlib.pyplot as plt
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")
plt.show()
```
其中,stopwords.txt是一个文本文件,里面包含了一些常见的中文停用词,例如“的”、“是”、“在”等。simhei.ttf是一种中文字体,用于在词云中显示中文。
最后,运行代码即可生成词云。
阅读全文