请用python爬取重庆环境处罚数据全部结果,并储存到excel中,写一下详细代码。网址为https://sthjj.cq.gov.cn/zwgk_249/zfxxgkzl/fdzdgknr/xzcf1/xzcfjd/

时间: 2023-08-15 14:04:48 浏览: 64
### 回答1: 这是一个Python爬虫的代码,可以用来爬取重庆环境处罚信息,并将结果存储到Excel中:import requests from bs4 import BeautifulSoup import xlwturl = 'https://sthjj.cq.gov.cn/zwgk_249/zfxxgkzl/fdzdgknr/xzcf1/xzcfjd/' wb = xlwt.Workbook() sheet = wb.add_sheet('重庆环境处罚信息')# 设置表头 head = ['标题', '处罚依据', '处罚时间', '处罚机关', '处罚对象', '处罚结果'] for i in range(len(head)): sheet.write(0, i, head[i])# 发送请求 response = requests.get(url) soup = BeautifulSoup(response.text, 'lxml') items = soup.find_all('div', class_='list_box')# 解析页面 for i, item in enumerate(items): title = item.find('span', class_='title').get_text().strip() cite = item.find('span', class_='cite').get_text().strip() time = item.find('span', class_='time').get_text().strip() office = item.find('span', class_='office').get_text().strip() object = item.find('span', class_='object').get_text().strip() result = item.find('span', class_='result').get_text().strip() sheet.write(i + 1, 0, title) sheet.write(i + 1, 1, cite) sheet.write(i + 1, 2, time) sheet.write(i + 1, 3, office) sheet.write(i + 1, 4, object) sheet.write(i + 1, 5, result)# 保存到excel wb.save('重庆环境处罚信息.xls') ### 回答2: 要用Python爬取重庆环境处罚数据并储存在Excel中,首先需要安装相关库,如requests、beautifulsoup4和openpyxl。 ``` pip install requests beautifulsoup4 openpyxl ``` 然后,我们可以使用以下代码来实现: ```python import requests from bs4 import BeautifulSoup from openpyxl import Workbook # 创建Excel工作簿 wb = Workbook() # 选择活动的工作表 ws = wb.active # 添加表头 ws.append(['案件名称', '处罚对象', '处罚时间', '处罚结果']) # 请求网页获取数据 url = 'https://sthjj.cq.gov.cn/zwgk_249/zfxxgkzl/fdzdgknr/xzcf1/xzcfjd/' response = requests.get(url) soup = BeautifulSoup(response.text, 'html.parser') # 获取数据条目 items = soup.find_all('li', {'class': 'hasSub'}) # 解析数据并写入Excel for item in items: case_name = item.find('div', {'class': 'txt'}).text punished_object = item.find_all('span')[1].text punishment_date = item.find_all('span')[3].text punishment_result = item.find_all('span')[5].text ws.append([case_name, punished_object, punishment_date, punishment_result]) # 保存Excel文件 wb.save('重庆环境处罚数据.xlsx') ``` 以上代码通过requests库请求网页内容,然后使用BeautifulSoup库解析HTML页面。接着,我们根据网页的结构找到对应的数据条目,并提取案件名称、处罚对象、处罚时间和处罚结果。最后,将提取到的数据写入一个Excel文件中。 运行代码后,会生成一个名为"重庆环境处罚数据.xlsx"的Excel文件,包含了所有的处罚数据。 ### 回答3: import requests from bs4 import BeautifulSoup import pandas as pd # 发送请求 url = 'https://sthjj.cq.gov.cn/zwgk_249/zfxxgkzl/fdzdgknr/xzcf1/xzcfjd/' response = requests.get(url) # 解析网页内容 soup = BeautifulSoup(response.text, 'html.parser') table = soup.find('tbody') # 找到表格的tbody标签 # 提取并储存数据 data = [] for tr in table.find_all('tr'): row = [] for td in tr.find_all('td'): row.append(td.text.strip()) # 提取每个单元格的文本并去除首尾空格 data.append(row) # 将数据保存到Excel文件中 df = pd.DataFrame(data) df.to_excel('重庆环境处罚数据.xlsx', index=False, header=False) # index=False和header=False去掉索引和表头 print("数据已保存到Excel文件中。")

相关推荐

最新推荐

Android 开发视频播放器源码代码逻辑清晰.zip

Android 开发视频播放器源码代码逻辑清晰

经典织构分析软件textool-欧拉角与米勒指数相互转换.zip

经典织构分析软件textool-欧拉角与米勒指数相互转换

Java 开发项目申报系统源码ssh框架+数据库.zip

Java 开发项目申报系统源码ssh框架+数据库

Java 开发教学管理项目源码+数据库项目可运行无报错,代码清晰适合新手.rar

Java 开发教学管理项目源码+数据库项目可运行无报错,代码清晰适合新手

ChatGPT技术在人工智能创作中的应用.docx

ChatGPT技术在人工智能创作中的应用

基于at89c51单片机的-智能开关设计毕业论文设计.doc

基于at89c51单片机的-智能开关设计毕业论文设计.doc

"蒙彼利埃大学与CNRS联合开发细胞内穿透载体用于靶向catphepsin D抑制剂"

由蒙彼利埃大学提供用于靶向catphepsin D抑制剂的细胞内穿透载体的开发在和CNRS研究单位- UMR 5247(马克斯·穆塞隆生物分子研究专长:分子工程由Clément Sanchez提供于2016年5月26日在评审团面前进行了辩护让·吉隆波尔多大学ARNA实验室CNRS- INSERM教授报告员塞巴斯蒂安·帕波特教授,CNRS-普瓦捷大学普瓦捷介质和材料化学研究所报告员帕斯卡尔·拉斯特洛教授,CNRS-审查员让·马丁内斯蒙彼利埃大学Max Mousseron生物分子研究所CNRS教授审查员文森特·利索夫斯基蒙彼利埃大学Max Mousseron生物分子研究所CNRS教授论文主任让-弗朗索瓦·赫尔南德斯CNRS研究总监-蒙彼利埃大学Max Mousseron生物分子研究论文共同主任由蒙彼利埃大学提供用于靶向catphepsin D抑制剂的细胞内穿透载体的开发在和CNRS研究单位- UMR 5247(马克斯·穆塞隆生物分子研究专长:分子工程由Clément Sanchez提供�

设计一个程序有一个字符串包含n个字符 写一个函数 将此字符串中从第m个字符开始的全部字符复制成为另一个字符串 用指针c语言

以下是用指针实现将字符串中从第m个字符开始的全部字符复制成为另一个字符串的C语言程序: ```c #include <stdio.h> #include <stdlib.h> #include <string.h> void copyString(char *a, char *b, int n, int m); int main() { int n, m; char *a, *b; printf("请输入字符串长度n:"); scanf("%d", &n); a = (char*)malloc(n * sizeof(char)); b =

基于C#多机联合绘图软件的实现-毕业设计论文.doc

基于C#多机联合绘图软件的实现-毕业设计论文.doc

4G车载网络中无线电资源的智能管理

4G车载网络中无线电资源的智能管理汽车网络从4G到5G的5G智能无线电资源管理巴黎萨克雷大学博士论文第580号博士学院博士专业:网络、信息与通信研究单位:巴黎萨克雷大学,UVSQ,LI PARAD,78180,法国伊夫林省圣昆廷参考:凡尔赛大学-伊夫林省圣昆廷论文于11月30日在巴黎萨克雷发表并答辩2021年,由玛丽亚姆·阿卢奇·马迪陪审团组成Pascal Lorenz总裁上阿尔萨斯大学大学教授Mohamed Yacine Ghamri-Doudane拉罗谢尔大学报告员和审查员教授Rami Langar报告员和审查员马恩河谷大学Oyunchimeg SHAGDARVEDECOM研发(HDR)团队负责人审查员论文方向Samir TOHME博士生导师巴黎萨克雷大学名誉教授UVSQ/LI- PARADKALLEL KHEMIRI共同监督巴黎萨克雷UVSQ/大卫Guy Pujolle受邀索邦大学Tara Yahiya邀请巴黎萨克雷大学/LISN高级讲师(HDR)博士论文NNT:2021UPASG061谢谢你首先,我要感谢我的论文导师M.萨米�