编写代码,爬取此页面源代码(urlib,urlib3,requests选其一),并观察图上源代码,使用相应库(re库,xpath/xml,bs4)爬取平均高温与平均低温
时间: 2024-12-17 09:34:07 浏览: 7
为了演示如何使用Python的`requests`库配合BeautifulSoup (`bs4`) 爬取网页的平均气温数据,我们首先需要获取网页的HTML源代码。假设目标网站的结构允许我们找到这些信息,并且数据位于特定的HTML元素中。这里是一个基本的例子:
```python
import requests
from bs4 import BeautifulSoup
# 目标URL
url = "https://example.com/weather-data" # 请替换为实际包含温度数据的URL
# 使用requests获取页面内容
response = requests.get(url)
# 检查请求是否成功
if response.status_code == 200:
# 解析HTML内容
soup = BeautifulSoup(response.text, 'html.parser')
# 假设平均高温和平均低温的信息在class为'temperature'的div标签内
avg_high_temp = soup.find('div', class_='temperature')['avg-high']
avg_low_temp = soup.find('div', class_='temperature')['avg-low']
print(f"平均高温: {avg_high_temp}")
print(f"平均低温: {avg_low_temp}")
else:
print(f"无法访问页面,状态码: {response.status_code}")
#
阅读全文