爬取https://news.sina.cn/zt_d/yiqing0121中全国疫情全部累计
时间: 2023-10-13 12:05:47 浏览: 163
scrapy爬取某官方平台新冠疫情数据
5星 · 资源好评率100%
为了实现该功能,我们需要使用 Python 语言及其相关的第三方库进行网页爬取和数据提取。具体步骤如下:
1. 安装相关库:我们需要安装 requests、beautifulsoup4 等库,可以使用 pip 进行安装。
2. 发送 HTTP 请求:使用 requests 库发送 HTTP GET 请求,获取网页内容。
3. 解析 HTML:使用 beautifulsoup4 库解析 HTML,提取需要的数据。
4. 提取数据:根据 HTML 网页结构,使用 beautifulsoup4 库提取出我们需要的数据。
5. 输出结果:将提取出的数据输出到控制台或写入文件中。
下面是实现该功能的代码示例:
```python
import requests
from bs4 import BeautifulSoup
url = 'https://news.sina.cn/zt_d/yiqing0121'
r = requests.get(url)
soup = BeautifulSoup(r.content, 'html.parser')
# 定位全国疫情累计的 div 标签
stat_div = soup.find('div', {'class': 'nums'})
# 提取数据
confirm = stat_div.find('span', {'class': 'confirm'}).text
suspect = stat_div.find('span', {'class': 'suspect'}).text
dead = stat_div.find('span', {'class': 'dead'}).text
heal = stat_div.find('span', {'class': 'heal'}).text
# 输出结果
print('全国疫情累计:')
print('确诊人数:', confirm)
print('疑似人数:', suspect)
print('死亡人数:', dead)
print('治愈人数:', heal)
```
执行上述代码后,将会输出全国疫情的累计数据。
阅读全文