爬虫全国水雨情站点经纬度
时间: 2023-08-29 21:05:08 浏览: 124
水库水雨情自动测报系统
要爬取全国水雨情站点的经纬度,你可以使用Python中的第三方库(如requests、BeautifulSoup等)来进行网页爬取和数据提取。以下是一个简单的示例代码,演示如何爬取全国水雨情网站的站点经纬度:
```python
import requests
from bs4 import BeautifulSoup
def get_station_coordinates():
url = 'http://www.hydroinfo.gov.cn/waterreport/realtime/list.html'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
table = soup.find('table', class_='table_data')
rows = table.find_all('tr')
station_coordinates = {}
for row in rows[1:]:
cells = row.find_all('td')
station_name = cells[1].text.strip()
latitude = cells[3].text.strip()
longitude = cells[4].text.strip()
station_coordinates[station_name] = (latitude, longitude)
return station_coordinates
# 示例用法
coordinates = get_station_coordinates()
for station, (latitude, longitude) in coordinates.items():
print(f"站点:{station},经度:{longitude},纬度:{latitude}")
```
上述代码中,我们首先发送HTTP请求获取全国水雨情网站的页面内容。然后使用BeautifulSoup库解析HTML内容,并通过CSS选择器找到对应的数据表格。接下来,我们遍历表格的每一行,提取站点名称、经度和纬度数据,并将其存储在一个字典中。
请注意,这只是一个示例,实际的网站结构可能有所不同。你需要根据目标网站的具体结构和HTML标签进行相应的调整。
另外,请务必遵守网站的使用规定和爬虫规范,避免对网站造成不必要的负荷和干扰。
阅读全文