import requests import re url = 'https://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word=%E6%A1%A5%E6%A2%81&pn=0&gsm=50&ct=&ic=0&lm=-1&width=0&height=0' headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Safari/537.36' } r = requests.get(url,headers=headers) ret = r.text # 获取所有类似"objURL"的图片链接 result = re.findall(r'"objURL":"(.*?)"',ret) for i in range(10): with open('img/{}.jpg'.format(i),'wb') as f: r = requests.get(result[i-1]) f.write(r.content)
时间: 2024-02-09 11:07:43 浏览: 69
import requests获取网页源代码.docx.url
你的代码是用 Python 语言编写的,使用了 requests 和 re 两个模块实现爬取百度图片搜索结果中的前 10 张图片,并保存到本地 img 文件夹中。其中,变量 url 存储了百度图片搜索的链接,headers 存储了请求头,使用 requests 模块向链接发送 GET 请求,获取响应结果。接着,使用正则表达式从响应结果中提取出所有的图片链接,存储到 result 列表中。最后,使用循环遍历 result 列表中前 10 个链接,通过 requests 模块发送 GET 请求,获取图片二进制内容,将其写入到本地 img 文件夹中的以数字命名的 jpg 文件中。
阅读全文