用爬虫爬取中央气象台的天气预报
时间: 2023-07-12 15:55:03 浏览: 201
您好,爬取中央气象台的天气预报需要通过发送 HTTP 请求获取网页源代码,然后使用正则表达式或者解析 HTML/XML 的库来提取天气预报信息。以下是一个简单的 Python 爬虫示例,可以帮助您完成这个任务:
```python
import requests
from bs4 import BeautifulSoup
url = 'http://www.nmc.cn/f/rest/real/54511'
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
response = requests.get(url, headers=headers)
soup = BeautifulSoup(response.text, 'html.parser')
# 获取天气预报信息
weather_info = soup.find('body').string
print(weather_info)
```
在这个示例中,我们使用了 requests 库来发送 HTTP 请求,并使用 BeautifulSoup 库来解析 HTML。我们发送了一个 GET 请求到中央气象台的 API 接口,该接口返回一个 JSON 格式的天气预报信息。我们使用 BeautifulSoup 来提取天气预报信息,并将其打印到控制台上。
需要注意的是,这个示例只是一个简单的爬虫示例,如果您想要实现更复杂的爬虫功能,还需要考虑数据存储、反爬虫策略等问题。
阅读全文