首页python爬虫百度图片

python爬虫百度图片

时间: 2023-11-01 20:07:12 浏览: 120

百度图片爬虫(python)

刚学习爬虫，写了一个百度图片爬虫当作练习。环境：python2.7(请下好第三方库requests) 实现的功能：输入关键字，下载270张关键字有关的百度图片到本地的()) 百度图片的加载是ajax异步形式的，除了前面的一部分图片，后面靠下拉加载的图片都是异步从服务器端请求得到的。这些异步加载的图片的信息可以在一个个acjson的百度图片接口中，可以在开发者工具中xhr下找到这些文件。

以下是一个简单的 Python 程序，用于从百度图片搜索结果中爬取图片： ``` import requests from bs4 import BeautifulSoup import os # 要爬取的图片关键词 keyword = "美食" # 图片保存目录 save_dir = "images" # 搜索结果页面的 URL url = "https://image.baidu.com/search/index?tn=baiduimage&word=" + keyword # 发送 HTTP 请求，获取搜索结果页面内容 response = requests.get(url) # 使用 BeautifulSoup 解析 HTML soup = BeautifulSoup(response.content, "html.parser") # 获取所有图片的 URL img_urls = [] for img in soup.find_all("img"): img_url = img.get("data-src") if img_url: img_urls.append(img_url) # 创建保存图片的目录 if not os.path.exists(save_dir): os.makedirs(save_dir) # 下载图片并保存到指定目录 for i, img_url in enumerate(img_urls): response = requests.get(img_url) with open(os.path.join(save_dir, f"{keyword}_{i}.jpg"), "wb") as f: f.write(response.content) ``` 这个程序使用 requests 库发送 HTTP 请求，使用 BeautifulSoup 解析 HTML，然后获取所有图片的 URL，并使用 requests 库下载图片并保存到指定目录。你只需要将 `keyword` 变量设置为你要搜索的关键词，运行程序即可开始爬取图片。请注意，爬取图片可能涉及到法律问题，请合法使用。

阅读全文