python爬虫百度图片
时间: 2023-11-01 20:07:12 浏览: 120
百度图片爬虫(python)
以下是一个简单的 Python 程序,用于从百度图片搜索结果中爬取图片:
```
import requests
from bs4 import BeautifulSoup
import os
# 要爬取的图片关键词
keyword = "美食"
# 图片保存目录
save_dir = "images"
# 搜索结果页面的 URL
url = "https://image.baidu.com/search/index?tn=baiduimage&word=" + keyword
# 发送 HTTP 请求,获取搜索结果页面内容
response = requests.get(url)
# 使用 BeautifulSoup 解析 HTML
soup = BeautifulSoup(response.content, "html.parser")
# 获取所有图片的 URL
img_urls = []
for img in soup.find_all("img"):
img_url = img.get("data-src")
if img_url:
img_urls.append(img_url)
# 创建保存图片的目录
if not os.path.exists(save_dir):
os.makedirs(save_dir)
# 下载图片并保存到指定目录
for i, img_url in enumerate(img_urls):
response = requests.get(img_url)
with open(os.path.join(save_dir, f"{keyword}_{i}.jpg"), "wb") as f:
f.write(response.content)
```
这个程序使用 requests 库发送 HTTP 请求,使用 BeautifulSoup 解析 HTML,然后获取所有图片的 URL,并使用 requests 库下载图片并保存到指定目录。你只需要将 `keyword` 变量设置为你要搜索的关键词,运行程序即可开始爬取图片。请注意,爬取图片可能涉及到法律问题,请合法使用。
阅读全文