首页如何正确编写python程序，爬取百度图片中猫和狗的图片各一百张，并存储至目标文件夹

如何正确编写python程序，爬取百度图片中猫和狗的图片各一百张，并存储至目标文件夹

时间: 2024-06-10 13:05:02 浏览: 65

利用python进行图片爬取

通过python对互联网上的图片进行批量的爬取，保存到本地。

您可以使用爬虫库Requests和BeautifulSoup对百度图片进行爬取。以下是Python代码示例： ``` import os import requests from bs4 import BeautifulSoup # 设置爬取图片的关键字和数量 keywords = ['猫', '狗'] num_images = 100 # 创建目标文件夹 target_folder = 'images' if not os.path.exists(target_folder): os.makedirs(target_folder) # 爬取并保存图片 for keyword in keywords: count = 0 while count < num_images: # 构造URL url = 'https://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word=' + keyword + '&pn=' + str(count) # 发送HTTP请求 response = requests.get(url) soup = BeautifulSoup(response.text, 'html.parser') # 解析HTML并下载图片 imgs = soup.find_all('img', {'class': 'main_img'}) for img in imgs: if count < num_images: img_url = img.get('src') if img_url is not None: img_data = requests.get(img_url).content file_name = target_folder + '/' + keyword + '_' + str(count + 1) + '.jpg' with open(file_name, 'wb') as f: f.write(img_data) count += 1 else: break # 打印进度 print(keyword + ': ' + str(count) + ' / ' + str(num_images)) ``` 此代码使用关键字“猫”和“狗”分别从百度图片中爬取100张图片，并保存至名为“images”的目标文件夹中。在运行代码之前，您需要安装Requests和BeautifulSoup库。

阅读全文