给我一个爬取网页图片的代码
时间: 2024-05-10 17:15:54 浏览: 7
以下是使用Python中的requests和beautifulsoup库来爬取网页图片的示例代码:
```python
import requests
from bs4 import BeautifulSoup
import os
url = 'https://www.example.com' # 网页链接
save_folder = 'images' # 图片保存文件夹
if not os.path.exists(save_folder):
os.makedirs(save_folder)
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
for img_tag in soup.find_all('img'):
img_url = img_tag.get('src')
if not img_url.startswith('http'):
img_url = url + img_url # 如果图片链接不是完整链接,则需要拼接
response = requests.get(img_url)
with open(os.path.join(save_folder, os.path.basename(img_url)), 'wb') as f:
f.write(response.content)
```
这个代码通过使用requests库发送HTTP请求,获取网页HTML代码,然后使用beautifulsoup库解析HTML代码,找到所有img标签,提取图片链接并保存到指定的文件夹中。请注意,在下载图片之前,我们还检查了图片链接是否是完整链接,如果不是,我们需要将其与网页链接组合在一起以获取完整的链接。