使用python爬取近两天的微博前十热搜并生成词云图,使用chrome浏览器
时间: 2024-04-21 21:28:21 浏览: 33
好的,可以使用Python的第三方库selenium、beautifulsoup4和wordcloud来实现。以下是一个简单的实现代码:
```python
import time
import jieba
from selenium import webdriver
from bs4 import BeautifulSoup
from wordcloud import WordCloud
# 使用Chrome浏览器
driver_path = 'chromedriver.exe' # 根据自己的实际情况修改
driver = webdriver.Chrome(driver_path)
# 打开微博热搜页面
url = 'https://s.weibo.com/top/summary'
driver.get(url)
# 等待页面加载完成
time.sleep(5)
# 获取近两天的微博热搜词汇
html = driver.page_source
soup = BeautifulSoup(html, 'html.parser')
keywords = []
for keyword in soup.select('.td-02 a')[:10]:
keywords.append(keyword.text)
# 将词汇列表转化为字符串
text = ' '.join(keywords)
# 使用jieba对文本进行分词
words = jieba.cut(text)
# 将分词结果转化为字符串
words_str = ' '.join(words)
# 生成词云图
wc = WordCloud(background_color='white', max_words=2000, font_path='msyh.ttc')
wc.generate(words_str)
wc.to_file('weibo_hot.png')
# 关闭浏览器
driver.quit()
```
这段代码首先使用selenium打开Chrome浏览器,并打开微博热搜页面。等待页面加载完成后,使用beautifulsoup4解析HTML代码,获取近两天的微博前十热搜词汇。接着使用jieba对词汇进行分词,最后使用wordcloud生成词云图并保存为本地文件。最后关闭Chrome浏览器。
相关推荐
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)