xpath怎么爬取图片
时间: 2023-11-08 07:47:04 浏览: 314
使用 XPath 爬取图片时,需要先找到包含图片链接的 HTML 元素,然后提取其中的 `src` 属性即可。
例如,如果想要爬取网页中所有的图片链接,可以使用以下代码:
```python
import requests
from lxml import html
# 发送请求获取网页内容
response = requests.get('https://example.com')
html_tree = html.fromstring(response.text)
# 使用 XPath 提取所有图片链接
img_links = html_tree.xpath('//img/@src')
# 输出所有图片链接
for link in img_links:
print(link)
```
如果只想要爬取特定元素中的图片链接,可以根据元素的 XPath 表达式来提取其中的图片链接,例如:
```python
# 使用 XPath 提取某个 div 元素中的图片链接
img_links = html_tree.xpath('//div[@class="example"]//img/@src')
```
在提取图片链接后,可以使用 Python 的 `requests` 库下载图片,例如:
```python
import requests
# 下载图片
response = requests.get('https://example.com/image.jpg')
with open('image.jpg', 'wb') as f:
f.write(response.content)
```
需要注意的是,爬取图片时需要遵守相关法律法规和网站的规定,避免侵犯他人的权益。
阅读全文