python 爬某个网站的图片
时间: 2023-11-01 09:03:05 浏览: 52
爬取某个网站的图片可以使用 Python 中的 requests 和 BeautifulSoup 库来实现。首先,我们需要使用 requests 库发送 HTTP 请求来获取网页的源代码,然后再使用 BeautifulSoup 库对源代码进行解析,从中提取出图片的链接。接下来,我们可以使用 requests 库再次发送 HTTP 请求来下载图片,并保存到本地。
下面是一个示例代码:
```python
import requests
from bs4 import BeautifulSoup
import os
# 定义爬取图片的网站链接
url = "https://www.example.com"
# 发送 HTTP 请求获取网页源代码
response = requests.get(url)
html = response.text
# 使用 BeautifulSoup 解析网页源代码
soup = BeautifulSoup(html, "html.parser")
# 创建保存图片的文件夹
if not os.path.exists("images"):
os.makedirs("images")
# 获取网页中的图片链接
img_tags = soup.find_all("img")
for img in img_tags:
img_url = img["src"]
# 组装完整的图片链接
if "http" not in img_url:
img_url = url + img_url
try:
# 发送 HTTP 请求下载图片
response = requests.get(img_url)
# 保存图片到本地
with open("images/{}.jpg".format(img_url.split("/")[-1]), "wb") as f:
f.write(response.content)
print("成功保存图片:{}".format(img_url))
except:
print("保存图片失败:{}".format(img_url))
```
以上代码会在当前目录下创建一个名为 images 的文件夹,然后根据网页中的图片链接下载并保存图片。注意,这只是一个简单的示例,实际爬取网站图片时需要根据具体情况进行适当的修改和处理。