写一个爬虫网页图片代码
时间: 2023-12-15 21:06:31 浏览: 23
以下是使用Python的requests和beautifulsoup4模块爬取网页图片的代码示例:
```python
import requests
from bs4 import BeautifulSoup
url = 'https://www.example.com' # 要爬取的网页URL
response = requests.get(url)
soup = BeautifulSoup(response.content, 'html.parser')
img_tags = soup.find_all('img') # 查找所有<img>标签
for img in img_tags:
img_url = img.get('src') # 获取图片的URL
if not img_url.startswith('http'): # 如果URL不是完整的http地址,则拼接完整的URL
img_url = url + img_url
img_name = img_url.split('/')[-1] # 获取图片的文件名
img_data = requests.get(img_url).content # 获取图片的二进制数据
with open(img_name, 'wb') as f:
f.write(img_data) # 将图片二进制数据写入本地文件
print('已保存图片:', img_name)
```
以上代码会将网页中所有的图片下载到本地,并以图片的文件名命名保存。注意,该代码仅适用于普通的静态网页,如果要爬取动态网页中的图片或者需要处理反爬虫机制,需要使用更复杂的爬虫技术。