首页写一个爬取网页图片

写一个爬取网页图片

时间: 2023-07-04 09:09:01 浏览: 98

以下是使用Python的requests和beautifulsoup库实现的一个简单网页图片爬取程序： ```python import requests from bs4 import BeautifulSoup import os url = "https://www.example.com" # 网页地址 save_folder = "images" # 图片保存文件夹 # 创建保存文件夹 if not os.path.exists(save_folder): os.makedirs(save_folder) # 获取网页内容 response = requests.get(url) html = response.text # 解析网页内容，获取所有图片链接 soup = BeautifulSoup(html, "html.parser") img_tags = soup.find_all("img") # 下载图片并保存到本地 for img in img_tags: img_url = img.get("src") if img_url.startswith("http"): img_name = img_url.split("/")[-1] save_path = os.path.join(save_folder, img_name) with open(save_path, "wb") as f: f.write(requests.get(img_url).content) print(f"{img_name} saved successfully.") ``` 该程序会在指定的网页中查找所有 `<img>` 标签，并下载其中的图片到本地的指定文件夹中。其中使用了 `requests` 库发送网络请求，`beautifulsoup` 库解析网页内容。同时也需要注意判断图片链接是否以 `http` 开头，避免下载非图片资源。

阅读全文