使用python爬取近两天前十的微博热搜,并进行分词,生成词云图。并且添加一个排错程序。、

时间: 2024-04-05 19:30:17 浏览: 11
好的,以下是代码实现: ```python import requests from bs4 import BeautifulSoup import jieba from wordcloud import WordCloud import matplotlib.pyplot as plt # 获取热搜榜数据 def get_hot_list(): try: url = 'https://s.weibo.com/top/summary?cate=realtimehot' headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} res = requests.get(url, headers=headers) res.raise_for_status() soup = BeautifulSoup(res.text, 'html.parser') hot_list = soup.select('.td-02') hot_words = [] for hot in hot_list[:10]: hot_words.append(hot.text.strip()) return hot_words except Exception as e: print(e) return [] # 生成词云图 def generate_wordcloud(seg_list): try: text = ' '.join(seg_list) wc = WordCloud(width=800, height=600, background_color='white', font_path='msyh.ttc') wc.generate(text) plt.imshow(wc, interpolation='bilinear') plt.axis('off') plt.show() except ValueError as e: print(e) # 分词 def do_segment(hot_words): seg_list = [] for hot_word in hot_words: seg_list += jieba.cut(hot_word, cut_all=False) return seg_list if __name__ == '__main__': hot_words = get_hot_list() if hot_words: seg_list = do_segment(hot_words) generate_wordcloud(seg_list) ``` 这段代码会首先定义三个函数: 1. `get_hot_list()`:用于获取近两天前十的微博热搜,返回一个包含前十热搜词的列表,如果获取失败则返回一个空列表。 2. `do_segment(hot_words)`:用于对热搜词进行分词,输入参数为热搜词列表,返回一个分词后的词语列表。 3. `generate_wordcloud(seg_list)`:用于生成词云图,输入参数为分词后的词语列表,如果分词后的列表为空则不生成词云图。 在主程序中,我们首先调用 `get_hot_list()` 函数获取前十的热搜词,如果获取成功则调用 `do_segment()` 函数对热搜词进行分词,最后调用 `generate_wordcloud()` 函数生成词云图。 在每个函数中,我们都添加了异常处理语句,以防止程序出现异常而崩溃,在 `get_hot_list()` 函数中使用了 `res.raise_for_status()` 语句,当请求返回的状态码不是 200 时,会抛出一个异常,避免获取到错误的数据。在 `generate_wordcloud()` 函数中,如果分词后的词语列表为空,会抛出 `ValueError` 异常,我们在函数中使用了 `try-except` 语句来捕获这个异常,以避免程序崩溃。 这样,我们就实现了一个可以爬取微博热搜并生成词云图的程序,并且添加了异常处理程序,避免了程序崩溃的情况。

相关推荐

最新推荐

recommend-type

安全网关HCSA,HCSP,Hillstone培训课程 从入门到抓包排错全包括

安全网关HCSA,HCSP,Hillstone培训课程 从入门到抓包排错全包括
recommend-type

VMware vSphere 6.7 性能优化最佳实践

VMware vSphere 6.7 u2 最佳实践,文档在官方社区可直接下载。但会受到网络影响,速度不快,我将下载好的放到这里,请各位自行选择下载还是去官网下载。 英文版。
recommend-type

idea: 不支持发行版本 5 11 12 13 compilation failed: internal java compiler error

文章目录问题排错与解决Step1、修改当前项目...网上搜了一大堆,大概有修改并统一project structure里面的所有java版本,比如,都改成1.8。 发现我自己项目里本来就都是统一的 原创文章 31获赞 18访问量 1万+ 关注
recommend-type

6900以上平台Raid 排错 状态检查 硬盘替换

6900以上平台Raid 排错 状态检查 硬盘替换。 经典实用文档,给真正需要的朋友使用。
recommend-type

zigbee-cluster-library-specification

最新的zigbee-cluster-library-specification说明文档。
recommend-type

管理建模和仿真的文件

管理Boualem Benatallah引用此版本:布阿利姆·贝纳塔拉。管理建模和仿真。约瑟夫-傅立叶大学-格勒诺布尔第一大学,1996年。法语。NNT:电话:00345357HAL ID:电话:00345357https://theses.hal.science/tel-003453572008年12月9日提交HAL是一个多学科的开放存取档案馆,用于存放和传播科学研究论文,无论它们是否被公开。论文可以来自法国或国外的教学和研究机构,也可以来自公共或私人研究中心。L’archive ouverte pluridisciplinaire
recommend-type

实现实时数据湖架构:Kafka与Hive集成

![实现实时数据湖架构:Kafka与Hive集成](https://img-blog.csdnimg.cn/img_convert/10eb2e6972b3b6086286fc64c0b3ee41.jpeg) # 1. 实时数据湖架构概述** 实时数据湖是一种现代数据管理架构,它允许企业以低延迟的方式收集、存储和处理大量数据。与传统数据仓库不同,实时数据湖不依赖于预先定义的模式,而是采用灵活的架构,可以处理各种数据类型和格式。这种架构为企业提供了以下优势: - **实时洞察:**实时数据湖允许企业访问最新的数据,从而做出更明智的决策。 - **数据民主化:**实时数据湖使各种利益相关者都可
recommend-type

用 Python 画一个可以动的爱心

好的,我可以帮助您使用Python来绘制一个动态的爱心。您可以使用turtle库来实现。以下是实现代码: ```python import turtle import math # 设置画布和画笔 canvas = turtle.Screen() canvas.bgcolor("black") pencil = turtle.Turtle() pencil.speed(0) pencil.color("red", "pink") pencil.pensize(3) # 定义爱心函数 def draw_love(heart_size, x_offset=0, y_offset=0):
recommend-type

JSBSim Reference Manual

JSBSim参考手册,其中包含JSBSim简介,JSBSim配置文件xml的编写语法,编程手册以及一些应用实例等。其中有部分内容还没有写完,估计有生之年很难看到完整版了,但是内容还是很有参考价值的。
recommend-type

"互动学习:行动中的多样性与论文攻读经历"

多样性她- 事实上SCI NCES你的时间表ECOLEDO C Tora SC和NCESPOUR l’Ingén学习互动,互动学习以行动为中心的强化学习学会互动,互动学习,以行动为中心的强化学习计算机科学博士论文于2021年9月28日在Villeneuve d'Asq公开支持马修·瑟林评审团主席法布里斯·勒菲弗尔阿维尼翁大学教授论文指导奥利维尔·皮耶昆谷歌研究教授:智囊团论文联合主任菲利普·普雷教授,大学。里尔/CRISTAL/因里亚报告员奥利维耶·西格德索邦大学报告员卢多维奇·德诺耶教授,Facebook /索邦大学审查员越南圣迈IMT Atlantic高级讲师邀请弗洛里安·斯特鲁布博士,Deepmind对于那些及时看到自己错误的人...3谢谢你首先,我要感谢我的两位博士生导师Olivier和Philippe。奥利维尔,"站在巨人的肩膀上"这句话对你来说完全有意义了。从科学上讲,你知道在这篇论文的(许多)错误中,你是我可以依