python三国演义词云图
时间: 2023-08-25 08:12:32 浏览: 124
好的,以下是用Python生成三国演义词云图的示例代码:
```python
import requests
from bs4 import BeautifulSoup
import jieba
from wordcloud import WordCloud
import matplotlib.pyplot as plt
# 获取文本数据
url = 'https://www.gutenberg.org/files/56120/56120-0.txt'
res = requests.get(url)
text = res.text
# 分词
words = jieba.cut(text)
# 去除停用词
stopwords = ['的', '了', '是', '在', '有', '不', '和', '与', '也', '就', '这', '他', '说', '为', '之', '而', '于', '上', '到', '又', '但', '人', '都', '我们', '一个', '可以', '没有', '还是', '可以', '进行', '这样']
filtered_words = []
for word in words:
if word not in stopwords:
filtered_words.append(word)
# 统计词频
word_count = {}
for word in filtered_words:
if word in word_count:
word_count[word] += 1
else:
word_count[word] = 1
# 生成词云图
wc = WordCloud(background_color='white', max_words=200, font_path='msyh.ttc')
wc.generate_from_frequencies(word_count)
plt.imshow(wc)
plt.axis('off')
plt.show()
```
这段代码与之前的示例代码基本一致,只是获取的文本数据变成了三国演义的文本数据。需要注意的是,这里使用的是三国演义的英文翻译版本,因此生成的词云图中可能会包含一些英文单词。如果想要生成中文版词云图,需要找到中文版的文本数据。
阅读全文