python使用selenium获取img中的src
时间: 2024-10-22 20:29:53 浏览: 42
在Python中,你可以使用Selenium库来自动化浏览器操作,包括抓取网页元素,如图片的`src`属性。Selenium通过webdriver模拟浏览器行为,可以动态加载页面并获取内容。以下是基本步骤:
1. 首先,安装Selenium库和对应的WebDriver(如ChromeDriver、FirefoxDriver等),可以使用pip命令安装:
```bash
pip install selenium
```
2. 下载对应浏览器的WebDriver,并将其路径添加到系统环境变量中。
3. 导入必要的模块:
```python
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
```
4. 启动浏览器会话:
```python
driver = webdriver.Chrome() # 或其他浏览器,如:webdriver.Firefox()
driver.get('目标网页URL')
```
5. 找到包含图片的元素。通常,`<img>`标签的`src`信息在`src`属性中。例如,如果我们知道图片元素的CSS选择器(ID或class名):
```python
img_element = driver.find_element_by_css_selector('#image_id') or driver.find_element_by_class_name('image_class')
```
或者如果图片在DOM上加载后才会显示,我们可以等待元素可用:
```python
wait = WebDriverWait(driver, 10) # 设置超时时间
img_element = wait.until(EC.presence_of_element_located((By.CSS_SELECTOR, '#image_id')))
```
6. 获取`src`属性的值:
```python
src_url = img_element.get_attribute('src')
print(src_url)
```
7. 完成任务后,记得关闭浏览器会话:
```python
driver.quit()
```
阅读全文