首页写一个爬虫网页图片代码

写一个爬虫网页图片代码

时间: 2023-12-15 21:06:31 浏览: 23

以下是使用Python的requests和beautifulsoup4模块爬取网页图片的代码示例： ```python import requests from bs4 import BeautifulSoup url = 'https://www.example.com' # 要爬取的网页URL response = requests.get(url) soup = BeautifulSoup(response.content, 'html.parser') img_tags = soup.find_all('img') # 查找所有<img>标签 for img in img_tags: img_url = img.get('src') # 获取图片的URL if not img_url.startswith('http'): # 如果URL不是完整的http地址，则拼接完整的URL img_url = url + img_url img_name = img_url.split('/')[-1] # 获取图片的文件名 img_data = requests.get(img_url).content # 获取图片的二进制数据 with open(img_name, 'wb') as f: f.write(img_data) # 将图片二进制数据写入本地文件 print('已保存图片：', img_name) ``` 以上代码会将网页中所有的图片下载到本地，并以图片的文件名命名保存。注意，该代码仅适用于普通的静态网页，如果要爬取动态网页中的图片或者需要处理反爬虫机制，需要使用更复杂的爬虫技术。