python爬取图片
时间: 2023-08-21 15:16:40 浏览: 47
Python使用爬虫技术来批量下载图片。爬虫是一种通过模拟浏览器行为从网页中提取数据的技术。具体实现步骤如下:
1. 首先,你需要导入相关的库,例如requests和re。requests库用于发送HTTP请求,re库用于正则表达式匹配。
2. 接下来,你需要设置请求头部,以模拟浏览器发送请求。可以使用User-Agent字段来设置请求头部。
3. 发送GET请求到目标网页,并获取返回的HTML内容。
4. 使用正则表达式匹配HTML内容中的图片链接。根据你提供的代码,可以使用`<img src="(.*?)" alt="(.*?)" width="160" height="120">`这个正则表达式来匹配图片链接。
5. 遍历匹配到的图片链接,使用requests库发送GET请求并获取图片内容。
6. 将获取到的图片内容保存到本地文件夹中。
根据你提供的代码,可以使用以下示例代码来实现图片的批量下载:
```python
import requests
import re
import os
image_folder = '表情包' # 设置保存图片的文件夹名称
if not os.path.exists(image_folder):
os.mkdir(image_folder)
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:98.0) Gecko/20100101 Firefox/98.0'
}
response = requests.get('https://qq.yh31.com/zjbq/', headers=headers)
response.encoding = 'utf-8'
pattern = r'<img src="(.*?)" alt="(.*?)" width="160" height="120">'
result = re.findall(pattern, response.text)
for img in result:
url = img