写一个爬取网页图片
时间: 2023-07-04 09:09:01 浏览: 98
以下是使用Python的requests和beautifulsoup库实现的一个简单网页图片爬取程序:
```python
import requests
from bs4 import BeautifulSoup
import os
url = "https://www.example.com" # 网页地址
save_folder = "images" # 图片保存文件夹
# 创建保存文件夹
if not os.path.exists(save_folder):
os.makedirs(save_folder)
# 获取网页内容
response = requests.get(url)
html = response.text
# 解析网页内容,获取所有图片链接
soup = BeautifulSoup(html, "html.parser")
img_tags = soup.find_all("img")
# 下载图片并保存到本地
for img in img_tags:
img_url = img.get("src")
if img_url.startswith("http"):
img_name = img_url.split("/")[-1]
save_path = os.path.join(save_folder, img_name)
with open(save_path, "wb") as f:
f.write(requests.get(img_url).content)
print(f"{img_name} saved successfully.")
```
该程序会在指定的网页中查找所有 `<img>` 标签,并下载其中的图片到本地的指定文件夹中。其中使用了 `requests` 库发送网络请求,`beautifulsoup` 库解析网页内容。同时也需要注意判断图片链接是否以 `http` 开头,避免下载非图片资源。
阅读全文