用re爬取彼岸壁纸随便一页的所有照片下载到文件夹里
时间: 2024-12-12 18:20:28 浏览: 14
抓取网站上的图片通常涉及到网络请求、HTML解析以及文件操作。这里以Python的requests和BeautifulSoup库为例,演示如何使用`re`模块配合这两个库来实现这个需求。首先确保已安装了`requests`和`beautifulsoup4`库,如果没有,可以运行`pip install requests beautifulsoup4`。
```python
import os
import re
import requests
# 需要爬取的壁纸网址
url = "https://www.example.com/banri-wallpaper-page" # 替换成实际的壁纸页面地址
# 发送GET请求获取网页内容
response = requests.get(url)
content = response.text
# 使用BeautifulSoup解析HTML
soup = BeautifulSoup(content, 'html.parser')
# 找到包含图片元素的部分,假设图片链接都在`img`标签内
image_tags = soup.find_all('img')
# 创建保存图片的文件夹(如果不存在)
if not os.path.exists("wallpapers"):
os.makedirs("wallpapers")
# 提取并下载图片
for img_tag in image_tags:
img_url = img_tag['src'] # 获取图片链接
filename = os.path.join("wallpapers", os.path.basename(img_url)) # 构建本地文件名
# 下载图片
with requests.get(img_url, stream=True) as img_request:
if img_request.status_code == 200:
with open(filename, 'wb') as file:
for chunk in img_request.iter_content(chunk_size=1024):
file.write(chunk)
#
阅读全文