首页爬取https://www.kluniv.edu.cn/jzgcxy/szdw/jsml.htm图片

爬取https://www.kluniv.edu.cn/jzgcxy/szdw/jsml.htm图片

时间: 2023-10-07 10:13:12 浏览: 170

我可以给你提供一个Python爬取图片的示例代码，你可以参考一下： ```python import requests from bs4 import BeautifulSoup import os # 设置请求头 headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} # 请求页面并解析 url = 'https://www.kluniv.edu.cn/jzgcxy/szdw/jsml.htm' response = requests.get(url, headers=headers) soup = BeautifulSoup(response.text, 'html.parser') # 获取所有图片的链接 img_urls = [] for img in soup.find_all('img'): img_url = img['src'] if 'http' not in img_url: img_url = 'https://www.kluniv.edu.cn' + img_url # 处理相对路径 img_urls.append(img_url) # 创建目录保存图片 if not os.path.exists('images'): os.makedirs('images') # 下载图片 for i, img_url in enumerate(img_urls): response = requests.get(img_url, headers=headers) with open(f'images/{i}.jpg', 'wb') as f: f.write(response.content) ``` 这段代码会爬取页面 https://www.kluniv.edu.cn/jzgcxy/szdw/jsml.htm 上所有图片并保存到一个名为 `images` 的目录中。

阅读全文