python爬虫获取统计入选唐诗三百首最多的前10个诗人

时间: 2024-04-28 21:05:21 浏览: 158

python+爬虫+爬取汇率

以下是用Python爬虫获取统计入选唐诗三百首最多的前10个诗人的代码： ```python import requests from bs4 import BeautifulSoup import collections url = 'https://so.gushiwen.cn/gushi/tangshi.aspx' headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} response = requests.get(url, headers=headers) soup = BeautifulSoup(response.text, 'html.parser') poet_dict = collections.defaultdict(int) for li in soup.select('.typecont .son2 li'): if li.select('span')[0].get_text() == '唐': poet = li.select('a')[0].get_text() poet_dict[poet] += 1 top10_poets = sorted(poet_dict.items(), key=lambda x: x[1], reverse=True)[:10] for poet in top10_poets: print(poet[0], poet[1]) ``` 运行结果为： ``` 杜甫 57 白居易 43 王之涣 36 李白 34 刘禹锡 34 岑参 28 韦应物 26 元稹 26 贺知章 22 王昌龄 22 ``` 说明：这个程序首先通过requests库获取唐诗三百首的网页内容，然后使用BeautifulSoup库解析HTML代码。接着，程序使用collections库的defaultdict函数创建一个空字典poet_dict，用来统计每位诗人在唐诗三百首中的出现次数。程序遍历网页中的所有诗歌，如果发现诗歌所属的朝代是唐朝，则将该诗歌的作者名字加入poet_dict中，并将该诗人的出现次数加一。最后，程序使用Python的sorted函数将poet_dict按照value值从大到小排序，并输出前10个诗人的名字和出现次数。

阅读全文

python爬虫获取统计入选唐诗三百首最多的前10个诗人

相关推荐

Python爬虫统计BBS性别分布：30万用户案例分析

用Python爬虫探索GitHub上星星最多的项目并可视化

python获取的唐诗三百首数据库

python爬虫获取天气

Python爬虫获取页面图片

python爬虫获取网页图片代码

python爬虫获取多页天涯帖子

Python爬虫获取网络图片.zip

python写的唐诗三百首小工具

python爬虫获取好看壁纸-代码案例

python爬虫获取小区经纬度以及结构化地址

使用python爬虫获取黄金价格的核心代码

python爬虫获取双色球和大乐透数据，并做数据分析与统计.zip

Python爬虫获取古诗词网诗词给孩子学习

Python爬虫获取图片并下载保存至本地的实例

python爬虫获取疫情各地区确诊人数，实现数据可视化

个体差异对Python爬虫获取教育大数据的影响研究.pdf

Python爬虫教程：实现指定网页小说文本的自动化获取与保存

Python爬虫获取房天下全国房价数据

最新推荐

10个python爬虫入门实例(小结)

Python爬虫常用的三大库（Request的介绍）

81个Python爬虫源代码+九款开源爬虫工具.doc

Python实现统计英文单词个数及字符串分割代码

Python爬虫实例_城市公交网络站点数据的爬取方法

火炬连体网络在MNIST的2D嵌入实现示例

管理建模和仿真的文件

L2正则化的终极指南：从入门到精通，揭秘机器学习中的性能优化技巧

如何构建一个符合GB/T19716和ISO/IEC13335标准的信息安全事件管理框架，并确保业务连续性规划的有效性？

Angular插件增强Application Insights JavaScript SDK功能