首页python爬取12306

python爬取12306

时间: 2023-12-16 20:28:07 浏览: 143

以下是使用Python爬取12306网站的步骤和注意事项： 1. 首先需要安装requests和BeautifulSoup库，可以使用pip命令进行安装。 2. 使用requests库发送HTTP请求，获取12306网站的HTML源代码。 3. 使用BeautifulSoup库解析HTML源代码，提取需要的信息。 4. 由于12306网站有反爬机制，需要使用一些反反爬技术，例如设置请求头、使用代理IP等。 5. 可以使用selenium库模拟浏览器行为，实现自动化爬取。 6. 注意不要频繁发送请求，以免被封IP。以下是一个简单的示例代码，可以爬取12306网站的车票信息： ```python import requests from bs4 import BeautifulSoup # 设置请求头 headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} # 发送HTTP请求，获取HTML源代码 url = 'https://kyfw.12306.cn/otn/leftTicket/query?leftTicketDTO.train_date=2022-01-01&leftTicketDTO.from_station=BJP&leftTicketDTO.to_station=SHH&purpose_codes=ADULT' response = requests.get(url, headers=headers) html = response.text # 解析HTML源代码，提取车票信息 soup = BeautifulSoup(html, 'html.parser') tickets = soup.select('tr[data-trace]') for ticket in tickets: train_no = ticket['data-trainno'] from_station = ticket['data-fromstation'] to_station = ticket['data-tostation'] start_time = ticket.select_one('.start-t')['title'] end_time = ticket.select_one('.end-t')['title'] duration = ticket.select_one('.ls-duration').text price = ticket.select_one('.ticket-price').text print(train_no, from_station, to_station, start_time, end_time, duration, price) ```

阅读全文

最新推荐

python爬取12306

相关推荐

详解python 爬取12306验证码

python爬取淘宝商品价格

python爬取微博关键词搜索博文

python爬取12306火车票信息

用python爬取12306网页

利用python爬取12306车次

给我一段代码实现利用python爬取12306车次

小白教程：Python爬取铁路12306

python爬取豆瓣

python爬取GBIF

Python爬取招聘

python爬虫正则表达式爬取12306出行指南网页数据

python爬取微博热点

python爬取微博

Python爬取知网文献

Python爬取VIP音乐

Python爬取知乎

Python爬取视频

python爬取美团

python 爬取京东

最新推荐

Python爬取数据并写入MySQL数据库的实例

用python爬取网页并导出为word文档.docx

python爬取cnvd漏洞库信息的实例

Python爬取破解无线网络wifi密码过程解析

Python爬取数据并实现可视化代码解析

C语言数组操作：高度检查器编程实践

管理建模和仿真的文件

【KUKA系统变量进阶】：揭秘从理论到实践的5大关键技巧

如何使用Python编程语言创建一个具有动态爱心图案作为背景并添加文字'天天开心（高级版）'的图形界面？

基于Swift开发的嘉定单车LBS iOS应用项目解析