用python写出一段代码,要求爬取世卫组织官方网站上所有关于新冠病毒的信息并输出为json格式文件,并且检查代码正确性提供检验代码或者输出文件
时间: 2024-04-08 10:36:28 浏览: 88
使用python爬取疫情数据
5星 · 资源好评率100%
以下是用 Python 爬取世卫组织官方网站上所有关于新冠病毒的信息并输出为 JSON 格式文件的示例代码:
```python
import requests
import json
from bs4 import BeautifulSoup
def scrape_who_covid_info():
# 发送 HTTP GET 请求获取网页内容
url = "https://www.who.int/emergencies/diseases/novel-coronavirus-2019"
response = requests.get(url)
html_content = response.text
# 使用 BeautifulSoup 解析网页内容
soup = BeautifulSoup(html_content, "html.parser")
# 查找相关信息的 HTML 元素
articles = soup.find_all("div", class_="sf-content-block")
# 初始化一个空的列表,用于存储爬取的信息
data = []
# 遍历每篇文章,提取标题和链接
for article in articles:
title = article.find("h2").text.strip()
link = article.find("a")["href"]
# 将标题和链接添加到数据列表中
data.append({"title": title, "link": link})
return data
# 爬取世卫组织官方网站上的信息
covid_info = scrape_who_covid_info()
# 将数据保存为 JSON 文件
filename = "who_covid_info.json"
with open(filename, "w", encoding="utf-8") as file:
json.dump(covid_info, file, ensure_ascii=False, indent=4)
print(f"爬取完成并保存为 {filename} 文件。")
```
你可以将上述代码保存为一个 Python 文件,并在命令行或集成开发环境中运行。它将爬取世卫组织官方网站上所有关于新冠病毒的信息,并将其保存为名为 "who_covid_info.json" 的 JSON 文件。
请确保你已经安装了必要的库(requests、BeautifulSoup)并能够访问世卫组织官方网站。如果代码执行成功,你将在当前目录下找到生成的 JSON 文件。你可以检查文件内容以验证代码正确性。
阅读全文