python爬取图片怎么做
时间: 2023-10-28 15:57:05 浏览: 63
要爬取图片,可以使用 Python 的 requests 库和 BeautifulSoup 库。首先,使用 requests 库发送 HTTP 请求获取网页的 HTML 内容,然后使用 BeautifulSoup 库解析 HTML 内容,找到所有的图片标签,提取图片的 URL,最后下载图片保存到本地即可。
下面是示例代码:
```python
import requests
from bs4 import BeautifulSoup
import os
# 请求头,模拟浏览器访问
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
# 目标网址
url = 'https://www.example.com'
# 发送请求
response = requests.get(url, headers=headers)
# 解析 HTML 内容
soup = BeautifulSoup(response.text, 'html.parser')
# 找到所有的图片标签
img_tags = soup.find_all('img')
# 下载图片
for img in img_tags:
img_url = img['src']
if img_url.startswith('http'):
# 获取图片二进制流
img_data = requests.get(img_url).content
# 图片保存路径
img_path = os.path.join('images', os.path.basename(img_url))
# 保存图片到本地
with open(img_path, 'wb') as f:
f.write(img_data)
```
上述代码会在当前目录下创建一个 images 文件夹,并将爬取到的所有图片保存到该文件夹中。
阅读全文