try: res = requests.get(url=URL, headers=headers) res.encoding = res.apparent_encoding img_info = re.findall('<a href="(.*?)" title=".*?target="_blank"><img src="(.*?)" alt=".*?', res.text) saved_count = 0 # 记录已保存的图片数量 for link, title in img_info: link = "http://www.netbian.com" + link res1 = requests.get(url=link, headers=headers) res1.encoding = res1.apparent_encoding img_url = re.findall('target="_blank"><img src="(.*?)" alt=".*?', res1.text)
时间: 2024-04-19 14:26:12 浏览: 265
Python程序设计:requests模块.pptx
这段代码是一个简单的爬虫程序,使用requests库发送请求并解析网页内容,提取图片链接。具体的步骤如下:
1. 使用requests库发送GET请求,获取目标网页的内容。
2. 设置编码方式,确保正确解析网页内容。
3. 使用正则表达式提取图片链接的相关信息,存储在img_info列表中。
4. 遍历img_info列表,获取每张图片的详细信息。
5. 根据提取到的链接,发送请求获取图片的二进制数据。
6. 可以将图片保存到本地,或者进行其他处理。
需要注意的是,该代码只提供了基本的爬取图片链接的功能,并没有完整的保存图片到本地的代码。你可以根据需要自行编写保存图片的逻辑。另外,爬取图片时请遵守相关法律法规,不得侵犯他人权益。
阅读全文