提供一个python爬取网页图片的代码
时间: 2024-05-08 20:18:50 浏览: 83
通过python爬取网页图片
5星 · 资源好评率100%
当然可以,以下代码可以帮您实现爬取网页图片的功能:
```python
import requests
from bs4 import BeautifulSoup
import os
url = "https://example.com/page1.html" # 网页url
headers = { # 添加headers,模拟浏览器访问,防止被封IP
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
response = requests.get(url, headers=headers) # 发送请求
soup = BeautifulSoup(response.text, "html.parser") # 解析网页
imgs = soup.find_all("img") # 找到所有图片标签
if not os.path.exists("images"): # 如果目录不存在则创建一个
os.mkdir("images")
for img in imgs:
if img.get("src").startswith("http"): # 只爬取HTTP/HTTPS协议的图片
img_url = img.get("src")
file_name = img_url.split("/")[-1] # 获取图片名称
file_path = f"images/{file_name}"
with open(file_path, "wb") as f: # 下载图片并保存
f.write(requests.get(img_url).content)
print(f"{file_name}下载完成")
```
这是一个简单的爬虫代码,您可以根据自己需要进行修改。
阅读全文