在spyder下,编写一个python文件对DOI 批量 下载文献 pdf,所使用的浏览器是edge
时间: 2023-06-11 15:05:07 浏览: 143
通过python爬虫批量下载PDF文件
,该怎么做呢?
您可以使用Selenium库来模拟浏览器操作,实现自动化下载。具体步骤如下:
1.安装Selenium库和Webdriver,Webdriver是Selenium的驱动程序,用于控制不同的浏览器,这里我们需要安装Edge的驱动。
2.编写Python脚本,引入Selenium库和Webdriver,然后使用Webdriver打开Edge浏览器。
3.通过Selenium的find_element_by_xpath方法找到DOI输入框并输入DOI,再点击搜索按钮。
4.找到下载按钮并点击,这样就可以下载PDF文献了。
下面是一个简单的Python脚本示例:
```python
from selenium import webdriver
import time
# 设置Edge浏览器的驱动,注意要添加到环境变量中
driver = webdriver.Edge()
# 打开网页
driver.get('https://www.sci-hub.ren/')
# 查找DOI输入框并输入DOI,注意需要加上 DOI: 前缀
doi_input = driver.find_element_by_xpath('//*[@id="input"]/form/input[1]')
doi_input.send_keys('DOI:10.1016/j.clinbiochem.2014.09.014')
# 点击搜索按钮
search_btn = driver.find_element_by_xpath('//*[@id="open"]/table/tbody/tr/td[1]/form/input[2]')
search_btn.click()
# 等待3秒后再查找下载按钮并点击
time.sleep(3)
download_btn = driver.find_element_by_xpath('//*[@id="pdf"]')
download_btn.click()
# 关闭浏览器
driver.quit()
```
注意:该脚本仅用于学习和研究,不可用于任何商业或非法用途。
阅读全文