https://re.jd.com/search?keyword=%E6%98%9F%E5%B7%B4%E5%85%8B%E6%98%9F%E5%86%B0%E4%B9%90%E5%92%96%E5%95%A1%E9%A5%AE%E6%96%99&page=1&keywordid=521577228427用xpath爬取该网站的图片
时间: 2024-04-28 18:19:13 浏览: 131
好的,以下是使用Python的xpath爬取该网站的图片的示例代码:
```python
import requests
from lxml import html
url = 'https://re.jd.com/search?keyword=%E6%98%9F%E5%B7%B4%E5%85%8B%E6%98%9F%E5%86%B0%E4%B9%90%E5%92%96%E5%95%A1%E9%A5%AE%E6%96%99&page=1&keywordid=521577228427'
response = requests.get(url)
# 将html文本转换为Element对象
element = html.fromstring(response.text)
# 获取所有class为'err-product'的img标签
img_list = element.xpath('//img[@class="err-product"]')
# 下载图片
for img in img_list:
img_url = img.xpath('./@src')[0]
img_name = img.xpath('./@alt')[0]
with open(img_name + '.jpg', 'wb') as f:
f.write(requests.get(img_url).content)
```
该程序使用requests库发送请求,使用lxml库将返回的html文本转换为Element对象,然后使用xpath语法查找所有class为'err-product'的img标签,获取图片链接和名称,最后使用requests库下载图片到本地。需要注意的是,xpath语法的学习和掌握需要一定的时间和经验。
阅读全文