undetected-chromedriver使用详解
时间: 2023-10-30 14:05:26 浏览: 281
undetected-chromedriver 是一个 Python 库,用于解决使用 Selenium 和 ChromeDriver 时被网站检测到并拒绝访问的问题。它可以通过模拟真实用户行为来绕过网站的反爬虫机制,使得我们可以更加稳定地爬取数据。
下面是使用 undetected-chromedriver 的详细步骤:
1. 安装 undetected-chromedriver
可以使用 pip 直接安装:
```
pip install undetected-chromedriver
```
2. 导入库
```python
from undetected_chromedriver import Chrome, ChromeOptions
```
3. 创建 ChromeOptions 对象,并设置参数
```python
options = ChromeOptions()
options.add_argument("--disable-blink-features=AutomationControlled") # 禁用自动化控制特性
options.add_argument("--disable-infobars") # 隐藏 Chrome 正在受到自动化控制的提示
options.add_argument("--disable-notifications") # 禁用通知
options.add_argument("--disable-popup-blocking") # 禁用弹出窗口拦截
options.add_argument("--disable-gpu") # 禁用 GPU 加速
options.add_argument("--disable-dev-shm-usage") # 禁用 /dev/shm 使用
options.add_experimental_option("excludeSwitches", ["enable-automation"]) # 禁用自动化开关
options.add_experimental_option("useAutomationExtension", False) # 禁用自动化扩展
```
4. 创建 Chrome 对象,并使用 ChromeOptions 设置参数
```python
driver = Chrome(options=options)
```
5. 使用 Chrome 进行网页操作
```python
driver.get("https://www.baidu.com") # 打开百度
driver.find_element_by_id("kw").send_keys("Python") # 在搜索框中输入 Python
driver.find_element_by_id("su").click() # 点击搜索按钮
```
6. 关闭 Chrome
```python
driver.quit()
```
以上就是使用 undetected-chromedriver 的详细步骤,希望对您有帮助。
阅读全文