爬虫drugbank
时间: 2023-08-21 20:07:06 浏览: 80
你可以使用Python编写一个爬虫来获取DrugBank网站的数据。以下是一个简单的示例代码,使用了Requests库和BeautifulSoup库来进行网页请求和解析:
```python
import requests
from bs4 import BeautifulSoup
# 设置请求头部,模拟浏览器访问
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'
}
# 发送GET请求获取网页内容
response = requests.get('https://go.drugbank.com/drugs', headers=headers)
# 使用BeautifulSoup解析网页内容
soup = BeautifulSoup(response.text, 'html.parser')
# 找到所有药物链接
drug_links = soup.find_all('a', class_='name-link')
# 打印药物名称和链接
for link in drug_links:
drug_name = link.text.strip()
drug_url = 'https://go.drugbank.com' + link['href']
print(drug_name, drug_url)
```
这段代码会获取DrugBank网站上所有药物的名称和链接。你可以根据自己的需求修改代码,提取其他的药物信息。注意,爬取网站数据时请遵守网站的使用规则和政策。