写一段代码可以爬取百度搜索的图片并保存在指定文件夹里
时间: 2023-12-06 12:43:58 浏览: 95
可以爬取某一个站点的图片,然后存储与指定文件夹
以下是一个Python爬虫示例,可以从百度搜索中下载图片并保存在指定文件夹中:
```python
import requests
import os
# 搜索关键词
keyword = '猫咪'
# 图片保存路径
save_folder = './images/'
# 创建保存图片的文件夹
if not os.path.exists(save_folder):
os.makedirs(save_folder)
# 请求头信息
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
# 搜索结果页数
page_num = 3
for i in range(page_num):
# 构建请求url
url = 'https://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&is=&fp=result&queryWord=' + \
keyword + '&cl=2&lm=-1&ie=utf-8&oe=utf-8&adpicid=&st=&z=&ic=&word=' + \
keyword + '&s=&se=&tab=&width=&height=&face=&istype=&qc=&nc=&fr=&pn=' + \
str(i * 30) + '&rn=30&gsm=1e&1597657350180='
# 发送请求
response = requests.get(url, headers=headers)
# 解析请求结果
json_data = response.json()
# 遍历所有图片信息,下载并保存图片
for item in json_data['data']:
if 'thumbURL' in item:
img_url = item['thumbURL']
img_name = os.path.basename(img_url)
# 下载图片
img_data = requests.get(img_url, headers=headers).content
# 保存图片
with open(save_folder + img_name, 'wb') as f:
f.write(img_data)
print('下载图片:', img_name)
```
注意,这只是一个基本的爬虫示例,需要根据自己的需求进行修改和优化。同时,要注意爬取图片的版权问题,不要侵犯他人的合法权益。
阅读全文