Selenium使用edge爬取利用js跳转的页面
时间: 2023-12-02 08:05:20 浏览: 172
要利用Selenium和Microsoft Edge浏览器爬取使用JS跳转的页面,可以按照以下步骤:
1. 安装Selenium和Edge浏览器驱动程序
2. 导入Selenium和Edge驱动程序的库
```python
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.edge.service import Service as EdgeService
```
3. 创建一个Edge浏览器实例
```python
# 创建Edge浏览器实例
edge_service = EdgeService('C:/Program Files (x86)/Microsoft/Edge/Application/msedgedriver.exe') # Edge驱动程序的路径
edge_options = webdriver.EdgeOptions()
edge_options.use_chromium = True
edge_options.add_argument('--disable-extensions')
edge_options.add_argument('--profile-directory=Default')
edge_options.add_argument("--incognito")
edge_options.add_argument("--disable-plugins-discovery")
edge_options.add_argument("--start-maximized")
edge_options.add_argument("--disable-blink-features=AutomationControlled")
driver = webdriver.Edge(service=edge_service, options=edge_options)
```
4. 访问目标网站并等待页面加载完成
```python
# 访问目标网站
driver.get("https://example.com")
# 等待页面加载完成
driver.implicitly_wait(10)
```
5. 查找页面元素并执行JS脚本跳转到目标页面
```python
# 查找页面元素
element = driver.find_element_by_id("element_id")
# 执行JS脚本跳转到目标页面
driver.execute_script("arguments[0].click();", element)
```
6. 等待目标页面加载完成并获取页面内容
```python
# 等待目标页面加载完成
driver.implicitly_wait(10)
# 获取页面内容
page_source = driver.page_source
```
7. 关闭浏览器实例
```python
# 关闭浏览器实例
driver.quit()
```
以上就是利用Selenium和Edge浏览器爬取使用JS跳转的页面的步骤。
阅读全文