如何正确编写python程序,爬取百度图片中猫和狗的图片各一百张,并存储至目标文件夹
时间: 2024-06-10 13:05:02 浏览: 65
利用python进行图片爬取
您可以使用爬虫库Requests和BeautifulSoup对百度图片进行爬取。以下是Python代码示例:
```
import os
import requests
from bs4 import BeautifulSoup
# 设置爬取图片的关键字和数量
keywords = ['猫', '狗']
num_images = 100
# 创建目标文件夹
target_folder = 'images'
if not os.path.exists(target_folder):
os.makedirs(target_folder)
# 爬取并保存图片
for keyword in keywords:
count = 0
while count < num_images:
# 构造URL
url = 'https://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word=' + keyword + '&pn=' + str(count)
# 发送HTTP请求
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
# 解析HTML并下载图片
imgs = soup.find_all('img', {'class': 'main_img'})
for img in imgs:
if count < num_images:
img_url = img.get('src')
if img_url is not None:
img_data = requests.get(img_url).content
file_name = target_folder + '/' + keyword + '_' + str(count + 1) + '.jpg'
with open(file_name, 'wb') as f:
f.write(img_data)
count += 1
else:
break
# 打印进度
print(keyword + ': ' + str(count) + ' / ' + str(num_images))
```
此代码使用关键字“猫”和“狗”分别从百度图片中爬取100张图片,并保存至名为“images”的目标文件夹中。在运行代码之前,您需要安装Requests和BeautifulSoup库。
阅读全文