首页用re爬取彼岸壁纸随便一页的所有照片下载到文件夹里

用re爬取彼岸壁纸随便一页的所有照片下载到文件夹里

时间: 2024-12-12 18:20:28 浏览: 14

抓取网站上的图片通常涉及到网络请求、HTML解析以及文件操作。这里以Python的requests和BeautifulSoup库为例，演示如何使用`re`模块配合这两个库来实现这个需求。首先确保已安装了`requests`和`beautifulsoup4`库，如果没有，可以运行`pip install requests beautifulsoup4`。 ```python import os import re import requests # 需要爬取的壁纸网址 url = "https://www.example.com/banri-wallpaper-page" # 替换成实际的壁纸页面地址 # 发送GET请求获取网页内容 response = requests.get(url) content = response.text # 使用BeautifulSoup解析HTML soup = BeautifulSoup(content, 'html.parser') # 找到包含图片元素的部分，假设图片链接都在`img`标签内 image_tags = soup.find_all('img') # 创建保存图片的文件夹（如果不存在） if not os.path.exists("wallpapers"): os.makedirs("wallpapers") # 提取并下载图片 for img_tag in image_tags: img_url = img_tag['src'] # 获取图片链接 filename = os.path.join("wallpapers", os.path.basename(img_url)) # 构建本地文件名 # 下载图片 with requests.get(img_url, stream=True) as img_request: if img_request.status_code == 200: with open(filename, 'wb') as file: for chunk in img_request.iter_content(chunk_size=1024): file.write(chunk) #

阅读全文