基于python的战狼影评词云可视化的代码
时间: 2023-09-29 19:03:48 浏览: 65
好的,以下是基于 Python 的战狼影评词云可视化的代码:
```python
import requests
from bs4 import BeautifulSoup
import jieba
from wordcloud import WordCloud
import matplotlib.pyplot as plt
# 获取影评数据
url = 'https://movie.douban.com/subject/26363254/comments?status=P'
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
response = requests.get(url, headers=headers)
soup = BeautifulSoup(response.content, 'html.parser')
comments = soup.find_all('span', {'class': 'short'})
# 对影评进行分词
text = ''
for comment in comments:
text += comment.get_text()
words = jieba.cut(text)
# 生成词云
wc = WordCloud(background_color='white', font_path='msyh.ttc', width=800, height=600, max_words=200)
wc.generate(' '.join(words))
# 显示词云
plt.imshow(wc)
plt.axis('off')
plt.show()
```
代码解释:
1. 首先使用 requests 库获取豆瓣电影《战狼2》的影评数据。
2. 使用 BeautifulSoup 库解析 HTML 页面,找到所有评论内容。
3. 对评论内容进行分词,使用 jieba 库进行中文分词。
4. 使用 WordCloud 库生成词云,设置背景颜色、字体、大小等参数。
5. 使用 matplotlib 库显示词云。
需要注意的是,为了能够正确地进行中文分词和显示中文字符,需要将字体文件(如上例中的“msyh.ttc”)放在代码所在目录下。
相关推荐
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)