import requests from lxml import etree url = 'https://www.vcg.com/sets/517310956' resp = requests.get(url,headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36 Edg/114.0.1823.37'}) #print(resp.text) xp = etree.HTML(resp.text) img_urls = xp.xpath('//body//div//section//div//div//div//section//figure//a//img/@src') img_names = xp.xpath('//body//div//section//div//div//div//section//figure//a//img/@alt') for u,n in zip(img_urls, img_names): print(f'图片名:{n} 地址:{u}') img_resp = requests.get(u, headers={'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36 Edg/114.0.1823.37'}) with open(f'./venv/img_f/{n}.jpg', 'wb') as f: f.write(img_resp.content)
时间: 2023-08-21 13:02:06 浏览: 230
python爬虫练习:爬图片
这是一段 Python 代码,它使用 requests 和 lxml 库来爬取一个网站上的图片,并将图片保存到本地文件夹中。其中,requests 库用于发送 HTTP 请求获取网页源代码,lxml 库用于解析网页源代码,提取出图片的 URL 和名称,然后使用 requests 库再次发送 HTTP 请求,将图片的二进制数据保存到本地文件夹中。如果你有任何问题或需要进一步解释,请告诉我。
阅读全文