用Python语言实现自行存储一段中文文字,根据该文字生成词云
时间: 2024-02-09 10:08:41 浏览: 132
使用python制作词云
5星 · 资源好评率100%
要生成中文词云,需要用到jieba库和wordcloud库。jieba库可以用来分词,而wordcloud库可以用来生成词云。
以下是一个使用Python语言的例子,实现根据一段中文文字生成词云的过程:
```python
import jieba
from wordcloud import WordCloud, STOPWORDS
import matplotlib.pyplot as plt
# 定义一段中文文字
text = "我爱编程,编程让我快乐,学习编程是我的梦想。"
# 使用jieba库进行分词
words = jieba.lcut(text)
# 定义停用词
stopwords = set(STOPWORDS)
stopwords.add("的")
# 将分词结果转换为字符串
words_str = " ".join([word for word in words if word not in stopwords])
# 使用wordcloud库生成词云
wordcloud = WordCloud(font_path="simhei.ttf", background_color="white").generate(words_str)
# 显示词云
plt.imshow(wordcloud, interpolation="bilinear")
plt.axis("off")
plt.show()
```
这个程序定义了一段中文文字,并使用jieba库进行分词。然后,定义了停用词,并将分词结果转换为字符串。最后,使用wordcloud库生成词云,并显示出来。
需要注意的是,为了正确显示中文,需要指定字体,这里使用了"simhei.ttf"字体。如果没有该字体,可以从网上下载并放置在程序目录下。
你可以根据自己的需要修改程序中的文字,定义自己的停用词表,调整词云的参数等。
阅读全文