python网络爬虫案例携程航班信息
时间: 2023-07-11 11:57:34 浏览: 178
好的,我可以帮你介绍一下Python网络爬虫携程航班信息的案例。
首先,我们需要使用Python中的requests和beautifulsoup库来实现爬虫功能。具体步骤如下:
1. 利用requests库向携程网站发送请求,获取搜索结果页面的HTML文档。
```python
import requests
url = 'http://flights.ctrip.com/schedule/'
params = {
'DCity1': 'BJS', # 出发城市
'ACity1': 'SHA', # 到达城市
'SearchType': 'S', # 搜索类型:单程
'DepDate': '2021-08-01' # 出发日期
}
response = requests.get(url, params=params)
html_doc = response.text
```
2. 利用beautifulsoup库解析HTML文档,获取航班信息。
```python
from bs4 import BeautifulSoup
soup = BeautifulSoup(html_doc, 'html.parser')
flight_list = soup.select('#base_bd > div > div > div > div > div > div > div > div > ul > li')
for flight in flight_list:
flight_number = flight.select_one('div.flight_logo > a').text.strip() # 航班号
departure_time = flight.select_one('div.start > strong').text.strip() # 出发时间
arrival_time = flight.select_one('div.arrive > strong').text.strip() # 到达时间
price = flight.select_one('div.price > strong').text.strip() # 价格
print(f'航班号:{flight_number},出发时间:{departure_time},到达时间:{arrival_time},价格:{price}')
```
这样,我们就可以通过Python网络爬虫获取携程航班信息了。当然,具体实现还需要考虑异常处理、存储数据等问题。
阅读全文