用pycharm爬取软科-高等教育评价领先品牌院校的内容并按照校名、地区、管理部门、类别、双一流共计5个字段进行解析最后保存到csv文件的代码

以下是用PyCharm爬取软科-高等教育评价领先品牌院校的内容并按照校名、地区、管理部门、类别、双一流共计5个字段进行解析最后保存到csv文件的代码： ``` import requests from bs4 import BeautifulSoup import csv # 设置请求头 headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} # 请求网页 url = 'http://www.zuihaodaxue.com/zuihaodaxuepaiming2019.html' response = requests.get(url, headers=headers) # 解析网页 soup = BeautifulSoup(response.content, 'html.parser') table = soup.find('table', attrs={'class': 'tablelist'}) # 获取表格头部信息 keys = [] for th in table.find_all('th'): keys.append(th.text) # 获取表格数据 data = [] for tr in table.find_all('tr')[1:]: row = {} tds = tr.find_all('td') row[keys[0]] = tds[0].text.strip() row[keys[1]] = tds[1].text.strip() row[keys[2]] = tds[2].text.strip() row[keys[3]] = tds[3].text.strip() row[keys[4]] = tds[4].text.strip() data.append(row) # 将数据保存到csv文件中 with open('university.csv', 'w', encoding='utf-8', newline='') as f: writer = csv.DictWriter(f, fieldnames=keys) writer.writeheader() writer.writerows(data) print('数据保存成功！') ``` 解析： 1. 首先，我们需要设置请求头，以模拟浏览器请求。 2. 然后，我们发送请求获取网页的HTML内容。 3. 接着，我们使用BeautifulSoup库解析HTML内容，找到表格数据。 4. 我们首先获取表头信息，然后逐行获取表格数据，将每行数据保存为一个字典类型，再将所有行的字典类型保存为一个列表。 5. 最后，我们使用csv库将数据写入csv文件中。注意事项： 1. 在写入csv文件时，需要指定编码为utf-8，并设置newline=''，否则会出现空行。 2. 在获取表格数据时，需要注意表格头部信息和表格数据的不同处理方式。 3. 在保存数据时，需要注意将数据保存为字典类型，并使用csv.DictWriter()函数进行写入。

阅读全文

用pycharm爬取软科-高等教育评价领先品牌院校的内容并按照校名、地区、管理部门、类别、双一流 共计5个字段进行解析最后保存到csv文件的代码

相关推荐

python采集软科、QS、THE等国内外网大学排名数据等

利用爬虫获取高校及专业录取分数线的python代码

python大学排名爬取.docx

用pycharm scrapy框架爬取软科-高等教育评价领先品牌院校的前五页内容并按照校名、地区、管理部门、类别、双一流 共计5个字段进行解析最后保存到csv文件的代码

用pycharm爬取https://www.shanghairanking.cn/institution网站的前五页内容并按照校名、地区、管理部门、类别、双一流 共计5个字段进行解析最后保存到csv文件的代码

用pycharm爬取https://www.shanghairanking.cn/institution网站并按照校名、地区、管理部门、类别、双一流 共计5个字段进行解析最后保存到csv文件的代码

用pycharm爬取https://www.shanghairanking.cn/institution校名、地区、管理部门、类别、双一流的内容并写入csv文件的代码

用pycharm的xpath语法爬取https://www.shanghairanking.cn/institution网站前五页的内容并按照校名、地区、管理部门、类别、双一流 共计5个字段进行解析最后保存到csv文件的代码

用pycharm爬取https://www.shanghairanking.cn/institution前五页的校名、地区、管理部门、类别、双一流的内容并写入csv文件的代码

用pycharm的xpath语法爬取https://www.shanghairanking.cn/institution网站并按照校名、地区、管理部门、类别、双一流 共计5个字段进行解析最后保存到csv文件的代码

用pycharm scrapy框架爬取https://www.shanghairanking.cn/institution校名、地区、管理部门、类别、双一流的内容并写入csv文件

用pycharm 爬取5000条完美日记这个品牌的评价，并且用谷歌浏览器爬取

用pycharm爬取4399

pycharm爬取图片

pycharm爬取酷狗

pycharm爬取微博

pycharm爬取疫情

pycharm爬取知乎网页

用pycharm爬取软科-高等教育评价领先品牌网站的院校的内容并按照校名、地区、管理部门、类别、双一流 共计5个字段进行解析最后保存到csv文件的代码

pycharm爬取软科-高等教育评价领先品牌院校一栏里面的内容

大家在看

基于自适应权重稀疏典范相关分析的人脸表情识别

香港地铁的安全风险管理 (2007年)

彩虹聚合DNS管理系统V1.3+搭建教程

一种新型三维条纹图像滤波算法 图像滤波算法.pdf

节的一些关于非传统-华为hcnp-数通题库2020/1/16（h12-221）v2.5

最新推荐

解决pycharm中opencv-python导入cv2后无法自动补全的问题(不用作任何文件上的修改)

Ubuntu18.04安装 PyCharm并使用 Anaconda 管理的Python环境

Python+Qt5+Pycharm 界面设计.docx

Python-Pycharm实现的猴子摘桃小游戏(源代码)

CarSim、MATLAB、PreScan，提供车辆动力学、运动控制联合仿真软件安装激活服务，可远程 内容包括： MATLAB R2018b win64 MATLAB R2020a win64 Pre

Terraform AWS ACM 59版本测试与实践

【HS1101湿敏电阻全面解析】：从基础知识到深度应用的完整指南

MATLAB在一个图形窗口中创建一行两列的子图的代码

Doks Hugo主题：打造安全快速的现代文档网站

E9流程表单前端接口API(V5)：前端与后端协同开发的黄金法则

用pycharm爬取软科-高等教育评价领先品牌院校的内容并按照校名、地区、管理部门、类别、双一流共计5个字段进行解析最后保存到csv文件的代码

用pycharm scrapy框架爬取软科-高等教育评价领先品牌院校的前五页内容并按照校名、地区、管理部门、类别、双一流共计5个字段进行解析最后保存到csv文件的代码

用pycharm爬取https://www.shanghairanking.cn/institution网站的前五页内容并按照校名、地区、管理部门、类别、双一流共计5个字段进行解析最后保存到csv文件的代码

用pycharm爬取https://www.shanghairanking.cn/institution网站并按照校名、地区、管理部门、类别、双一流共计5个字段进行解析最后保存到csv文件的代码

用pycharm的xpath语法爬取https://www.shanghairanking.cn/institution网站前五页的内容并按照校名、地区、管理部门、类别、双一流共计5个字段进行解析最后保存到csv文件的代码

用pycharm的xpath语法爬取https://www.shanghairanking.cn/institution网站并按照校名、地区、管理部门、类别、双一流共计5个字段进行解析最后保存到csv文件的代码

用pycharm爬取软科-高等教育评价领先品牌网站的院校的内容并按照校名、地区、管理部门、类别、双一流共计5个字段进行解析最后保存到csv文件的代码

一种新型三维条纹图像滤波算法图像滤波算法.pdf

CarSim、MATLAB、PreScan，提供车辆动力学、运动控制联合仿真软件安装激活服务，可远程内容包括： MATLAB R2018b win64 MATLAB R2020a win64 Pre