只用request和re这两个库进行抓取图片并下载
时间: 2024-10-29 11:25:35 浏览: 13
对不起,你提到的“request”和“re”两个库并不是Python标准库中的,可能是打错了。在Python中用于网络请求的是`requests`库,而正则表达式操作通常使用`re`库。但是,这两个库本身并不直接支持图片的下载,我们需要配合其他库如`BeautifulSoup`来解析HTML内容找到图片链接。
如果你想仅使用这两个库进行基本的图片下载,可以尝试使用`requests`获取页面源代码,然后使用正则表达式匹配图片链接。以下是一个简化示例,但请注意这可能会因为网站结构复杂而无法处理所有情况:
```python
import requests
import re
# 网页URL
url = '目标网页URL'
# 发送GET请求
response = requests.get(url)
html_content = response.text
# 使用正则表达式查找图片链接 (假设图片链接都是<img>标签内的src属性)
img_pattern = r'<img[^>]*src="([^"]+)"'
image_links = re.findall(img_pattern, html_content)
for link in image_links:
try:
# 下载图片
response_img = requests.get(link, stream=True)
filename = os.path.basename(link)
with open(filename, 'wb') as f:
for chunk in response_img.iter_content(chunk_size=8192):
f.write(chunk)
print(f"图片 {filename} 下载完成.")
except Exception as e:
print(f"下载图片失败: {e}")
阅读全文