首页python爬取图片

python爬取图片

时间: 2023-08-21 15:16:40 浏览: 47

Python使用爬虫技术来批量下载图片。爬虫是一种通过模拟浏览器行为从网页中提取数据的技术。具体实现步骤如下： 1. 首先，你需要导入相关的库，例如requests和re。requests库用于发送HTTP请求，re库用于正则表达式匹配。 2. 接下来，你需要设置请求头部，以模拟浏览器发送请求。可以使用User-Agent字段来设置请求头部。 3. 发送GET请求到目标网页，并获取返回的HTML内容。 4. 使用正则表达式匹配HTML内容中的图片链接。根据你提供的代码，可以使用`<img src="(.*?)" alt="(.*?)" width="160" height="120">`这个正则表达式来匹配图片链接。 5. 遍历匹配到的图片链接，使用requests库发送GET请求并获取图片内容。 6. 将获取到的图片内容保存到本地文件夹中。根据你提供的代码，可以使用以下示例代码来实现图片的批量下载： ```python import requests import re import os image_folder = '表情包' # 设置保存图片的文件夹名称 if not os.path.exists(image_folder): os.mkdir(image_folder) headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:98.0) Gecko/20100101 Firefox/98.0' } response = requests.get('https://qq.yh31.com/zjbq/', headers=headers) response.encoding = 'utf-8' pattern = r'<img src="(.*?)" alt="(.*?)" width="160" height="120">' result = re.findall(pattern, response.text) for img in result: url = img