首页爬虫drugbank

爬虫drugbank

时间: 2023-08-21 20:07:06 浏览: 80

你可以使用Python编写一个爬虫来获取DrugBank网站的数据。以下是一个简单的示例代码，使用了Requests库和BeautifulSoup库来进行网页请求和解析： ```python import requests from bs4 import BeautifulSoup # 设置请求头部，模拟浏览器访问 headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3' } # 发送GET请求获取网页内容 response = requests.get('https://go.drugbank.com/drugs', headers=headers) # 使用BeautifulSoup解析网页内容 soup = BeautifulSoup(response.text, 'html.parser') # 找到所有药物链接 drug_links = soup.find_all('a', class_='name-link') # 打印药物名称和链接 for link in drug_links: drug_name = link.text.strip() drug_url = 'https://go.drugbank.com' + link['href'] print(drug_name, drug_url) ``` 这段代码会获取DrugBank网站上所有药物的名称和链接。你可以根据自己的需求修改代码，提取其他的药物信息。注意，爬取网站数据时请遵守网站的使用规则和政策。