python在百度网页爬取1500张柯基图片并保存在相应文件
时间: 2023-12-29 18:05:49 浏览: 144
这里提供一个Python爬虫的示例代码,可以爬取百度图片中的柯基图片并保存到本地。
```python
import requests
import os
from bs4 import BeautifulSoup
# 创建文件夹用于存储图片
if not os.path.exists('corgi'):
os.mkdir('corgi')
# 设置爬取的页数
pages = 3
for i in range(1, pages+1):
# 构造URL
url = 'https://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word=%E6%9F%AF%E5%9F%BA&pn=' + str((i-1)*20)
# 发送请求
response = requests.get(url)
# 解析HTML并获取图片链接
soup = BeautifulSoup(response.text, 'html.parser')
img_tags = soup.find_all('img', class_='main_img')
# 下载图片并保存到本地
for j, img in enumerate(img_tags):
img_url = img['src']
response = requests.get(img_url)
with open(f'corgi/{i}_{j+1}.jpg', 'wb') as f:
f.write(response.content)
```
这段代码中,我们使用了requests和BeautifulSoup两个库来发送请求和解析HTML。首先,我们创建了一个名为"corgi"的文件夹来存储下载的图片。然后,我们设置了要爬取的页数,这里是3页。接着,我们循环遍历每一页的图片,并使用BeautifulSoup解析HTML,提取出图片链接。最后,我们使用requests库下载图片,并将其保存到本地。图片的命名格式为"页数_图片编号.jpg"。
阅读全文