首页python爬虫pubmed

python爬虫pubmed

时间: 2023-08-06 10:06:27 浏览: 155

你可以使用Python编写一个爬虫来抓取PubMed上的数据。首先，你需要安装BeautifulSoup和requests库来帮助你处理网页内容和发送HTTP请求。以下是一个简单的示例代码，演示如何爬取PubMed上的文章标题和摘要信息： ```python import requests from bs4 import BeautifulSoup def crawl_pubmed(keyword): # 构造查询URL base_url = 'https://pubmed.ncbi.nlm.nih.gov/' query_url = base_url + 'search/?term=' + keyword # 发送HTTP请求 response = requests.get(query_url) # 解析网页内容 soup = BeautifulSoup(response.text, 'html.parser') # 提取文章标题和摘要信息 articles = soup.find_all('article') for article in articles: title = article.find('a', class_='docsum-title').text.strip() abstract = article.find('div', class_='abstract-content').text.strip() print('Title:', title) print('Abstract:', abstract) print('---') # 调用爬虫函数 crawl_pubmed('python web scraping') ``` 请注意，这只是一个简单的示例，你可能需要根据你的需求进行进一步的定制。同时，请确保你遵守PubMed的使用规则和条款，以及任何相关的法律法规。

阅读全文