首页python采集https://www.shanghairanking.cn/rankings/bcur/202111 这个网站的20页的数据代码

python采集https://www.shanghairanking.cn/rankings/bcur/202111 这个网站的20页的数据代码

时间: 2023-11-15 18:06:16 浏览: 165

c#操作xml文件示例

1. 新增XML文件代码如下:XMLToolV2 _xmlHelper = new XMLToolV2(@”C:\20140311blogs.xml”);//xml保存路径或者读取路径 _xmlHelper.Create(“Person”, “utf-8”);//跟节点名称:person;encode:utf-8 XmlElement _person = _xmlHelper.CreateElec(“Name”, “Yan-Zhiwei”);//在跟节点后创建person节点 _xmlHelper.SetAttribute(_person, “Gender”, “Man”);//设置pers

好的，你可以使用 requests 和 BeautifulSoup 库来实现： ```python import requests from bs4 import BeautifulSoup # 构造请求头 headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/93.0.4577.63 Safari/537.36' } # 循环请求20页数据 for page in range(1, 21): url = f"https://www.shanghairanking.cn/rankings/bcur/202111?page={page}" response = requests.get(url, headers=headers) soup = BeautifulSoup(response.text, 'html.parser') # 解析数据 for tr in soup.select('#UniversityRanking > tbody > tr'): rank = tr.select_one('.rk').text.strip() name = tr.select_one('.univ-name').text.strip() location = tr.select_one('.location').text.strip() score = tr.select_one('.total-score').text.strip() print(rank, name, location, score) ``` 这个代码会爬取上海交通大学世界大学学术排名的数据，每页有25条数据，共爬取20页，将排名、学校名称、所在地、总分数输出到控制台。注意需要构造合适的请求头，以免被反爬虫机制拦截。

阅读全文

相关推荐

开通CSDN年卡参与万元壕礼抽奖

海量 VIP免费资源千本正版电子书商城会员专享价千门课程&专栏

全年可省5,000元立即开通全年可省5,000元立即开通

最新推荐

白色大气风格的商务团队公司模板下载.zip

python采集https://www.shanghairanking.cn/rankings/bcur/202111 这个网站的20页的数据代码

相关推荐

python采集https://www.shanghairanking.cn/rankings/bcur/202111 这个网站的数据代码

Python 如何读取：https://www.shanghairanking.cn/_nuxt/static/1685689051/rankings/bcur/2023/payload.js 内的内容

用python爬虫链接https://www.shanghairanking.cn/rankings/bcur/2023 返回前30名大学

使用python爬虫或自动化实现）爬取2024到excel:https://www.shanghairanking.cn/rankings/bcur/2024

使用网络爬虫工具爬虫https://www.shanghairanking.cn/rankings/bcur/202411该网站大学排名信息Python代码

如何用python代码提取https://www.shanghairanking.cn/rankings/arwu/2020网页里的表格数据

用pycharm爬取https://www.shanghairanking.cn/rankings/bcur/202414的全国参考排名

用python爬取https://www.shanghairanking.cn/institution网站的内容并写入csv文件的代码

pycharm简单爬取https://www.shanghairanking.com/rankings/bcur/2023学校排名

python实战小程序4，网络爬虫挑战。大学排名网站地址为https://www.shanghairanking.cn/rankings/bcur/202411。

对财经大学排名 https://www.shanghairanking.cn/rankings/bcur/202422 进行爬取 要求：使用正则表达式

爬取‘排名’，‘校名’，‘省市’，‘总分’，这四个字段信息（只需要前30条数据） 【网页地址为：https://www.shanghairanking.cn/rankings/bcur/202411】

抓取软科大学排名2024版前30名（https://w ww.shanghairanking.cn/rankings/bcur/202 4）并显示，将代码与结果放入答案中

抓取以下目标网站的信息：https://www.shanghairanking.cn/institution

用python爬虫爬取https://www.shanghairanking.cn/institution网站的内容并写入csv文件的代码

爬取https://www.shanghairanking.cn/rankings

用python爬虫爬取https://www.shanghairanking.cn/institution网站的校名、地区、管理部门、类别、双一流 并写入csv文件的代码

怎么爬虫下面这个网址的第二页https://www.shanghairanking.cn/rankings/gras/2022/RS0226

访问大学排名（https://www.shanghairanking.cn/rankings/bcur/2023），获取每个大学的排名、校名、评分，按照“排名-中文片名-评分”的格式显示在屏幕上。

最新推荐

白色大气风格的商务团队公司模板下载.zip

Windows平台下的Fastboot工具使用指南

管理建模和仿真的文件

DLMS规约深度剖析：从基础到电力通信标准的全面掌握

修改代码，使其正确运行

Python机器学习基础入门与项目实践

"互动学习：行动中的多样性与论文攻读经历"

【Shell脚本进阶】：wc命令行数统计的高级用法及解决方案

python编写一个程序，使得根据输入的起点和终点坐标值计算出坐标方位角

Achilles-2 原始压缩包内容解密

对财经大学排名 https://www.shanghairanking.cn/rankings/bcur/202422 进行爬取要求：使用正则表达式

爬取‘排名’，‘校名’，‘省市’，‘总分’，这四个字段信息（只需要前30条数据）【网页地址为：https://www.shanghairanking.cn/rankings/bcur/202411】

用python爬虫爬取https://www.shanghairanking.cn/institution网站的校名、地区、管理部门、类别、双一流并写入csv文件的代码