Python爬取北京公交车站信息
时间: 2024-12-20 12:30:30 浏览: 5
携程航班信息爬取(python)—第一次写博客,不好请别见外!
Python通过requests库通常用于发起HTTP请求获取网页数据,然后利用BeautifulSoup、Scrapy等库解析HTML内容,抓取到北京公交车站的信息。首先,你需要找到提供公交站信息的公开API或者网站,如果没有API,就可能需要进行一些网页解析工作。
以下是一个简单的示例,说明如何使用BeautifulSoup从一个静态HTML页面提取北京公交站信息:
```python
import requests
from bs4 import BeautifulSoup
# 目标网站URL
url = 'http://example.com/bus_stations_beijing'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
# 查找特定标签(如`div`或`ul`)中包含公交站信息的部分
stations_data = soup.find_all('div', class_='bus_station') # 类名假设为'bus_station'
for station in stations_data:
name = station.find('h3').text # 找到站名
location = station.find('p', class_='location').text # 找到位置信息
print(f"站名: {name}, 地点: {location}")
阅读全文