Python爬虫获取图片
时间: 2024-05-16 17:10:49 浏览: 117
Python爬虫获取图片的基本步骤如下:
1. 导入requests、os、re等模块
2. 使用requests库发送请求获取网页源码
3. 使用re模块或BeautifulSoup库解析网页源码,找到图片链接
4. 使用requests库发送请求获取图片二进制数据
5. 将图片保存到本地文件夹中
以下是一个简单的Python爬虫获取图片的示例代码:
```
import requests
import os
import re
url = 'http://www.example.com' # 网站地址
path = './images' # 图片保存路径
if not os.path.exists(path):
os.makedirs(path)
# 发送请求获取网页源码
response = requests.get(url)
html = response.text
# 使用正则表达式或BeautifulSoup库解析网页源码,找到图片链接
img_urls = re.findall(r'src="(.*?\.(jpg|png))"', html)
# 发送请求获取图片二进制数据,并保存到本地文件夹中
for img_url in img_urls:
img_name = img_url.split('/')[-1]
img_path = os.path.join(path, img_name)
img_response = requests.get(img_url)
with open(img_path, 'wb') as f:
f.write(img_response.content)
print('成功下载图片:', img_name)
```
阅读全文