import os import requests from bs4 import BeautifulSoup def download_images(keyword, num_images): url = f"https://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word={keyword}&ct=201326592&v=flip" response = requests.get(url) soup = BeautifulSoup(response.content, "html.parser") img_tags = soup.find_all("img") # 创建一个目录来保存图片 os.makedirs(keyword, exist_ok=True) count = 0 for img_tag in img_tags: if count == num_images: break img_url = img_tag["src"] try: # 下载图片 response = requests.get(img_url) with open(f"{keyword}/{count+1}.jpg", "wb") as f: f.write(response.content) count += 1 print(f"Downloaded image {count}/{num_images}") except: print(f"Failed to download image {count+1}") keyword = "香蕉" # 搜索的关键词 num_images = 20 # 要下载的图片数 download_images(keyword, num_images)为什么下载失败

时间: 2024-04-19 20:30:19 浏览: 137

下载失败可能有几种可能的原因： 1. 网络连接问题：请确保你的网络连接正常，并且可以正常访问百度图片网站。 2. 图片链接问题：有时候，网页上的图片链接可能已经失效或不可访问。这可能导致下载失败。你可以尝试打开图片链接来确认是否可以正常访问。 3. 权限问题：有些网站可能对爬虫进行限制，阻止了你的请求。你可以尝试设置一个合适的 User-Agent 头部来模拟浏览器行为，以绕过可能的限制。 4. 文件夹创建问题：在代码中，使用 `os.makedirs(keyword, exist_ok=True)` 来创建保存图片的目录。请确保你的代码有足够的权限来创建目录，并且目录不存在。 5. 异常处理问题：在代码中，使用了一个简单的异常处理语句 `except` 来处理下载图片时可能出现的异常。但是这样的处理方式可能会导致你无法得知具体的错误信息。你可以尝试修改异常处理代码，以便打印出更详细的错误信息，帮助你找到问题所在。请检查以上可能的原因，并根据具体的错误信息进行调试和排查。如果你能提供更多的错误信息和相关上下文，我可以帮助你更准确地定位问题。

import requests from bs4 import BeautifulSoup import os def download_images(keyword, num_images): url = f"https://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word={keyword}&ct=201326592&v=flip" response = requests.get(url) soup = BeautifulSoup(response.content, "html.parser") img_tags = soup.find_all("img", class_="main_img img-hover") # 创建一个目录来保存图片 os.makedirs(keyword, exist_ok=True) count = 0 for img_tag in img_tags: if count == num_images: break img_url = img_tag["src"] try: # 下载图片 response = requests.get(img_url) with open(f"{keyword}/{count+1}.jpg", "wb") as f: f.write(response.content) count += 1 print(f"Downloaded image {count}/{num_images}") except: print(f"Failed to download image {count+1}") keyword = "苹果" # 搜索的关键词 num_images = 10 # 要下载的图片数量 download_images(keyword, num_images)

这段代码使用了requests库和BeautifulSoup库来从百度图片搜索中下载指定关键词的图片。具体步骤如下： 1. 构建搜索URL：根据给定的关键词，构建百度图片搜索的URL。 2. 发送请求并解析HTML：使用requests库发送GET请求获取网页的HTML文档，并使用BeautifulSoup库解析HTML文档。 3. 查找图片标签：使用find_all方法从HTML文档中找到class属性为"main_img img-hover"的img标签，存储在img_tags变量中。 4. 创建目录：使用os.makedirs函数创建一个以关键词命名的目录，用于保存图片。 5. 下载图片：遍历img_tags列表，并依次下载对应的图片。将图片以关键词/序号.jpg的形式保存在之前创建的目录中。你提供的代码将下载指定关键词的前10张图片，并保存在以关键词命名的目录中。

import os import requests from bs4 import BeautifulSoup def create_image_folder(keyword): desktop_path = os.path.join(os.path.expanduser("~"), "Desktop") folder_path = os.path.join(desktop_path, keyword) os.makedirs(folder_path, exist_ok=True) return folder_path def download_images(keyword, folder_path): url = f"https://image.baidu.com/search/index?tn=baiduimage&word={keyword}" response = requests.get(url) response.raise_for_status() soup = BeautifulSoup(response.text, "html.parser") image_tags = soup.find_all("img", class_="main_img img-hover") for i, image_tag in enumerate(image_tags): image_url = image_tag.get("data-imgurl") if image_url: response = requests.get(image_url) response.raise_for_status() image_path = os.path.join(folder_path, f"{i+1}.jpg") with open(image_path, "wb") as f: f.write(response.content) print(f"下载图片 {i+1}") # 获取用户输入的关键词 keyword = input("请输入关键词：") # 创建文件夹并下载图片 folder_path = create_image_folder(keyword) download_images(keyword, folder_path)

这是一个用于从百度图片搜索下载图片的Python脚本。它使用了`os`和`requests`库来创建文件夹和发送HTTP请求，以及使用`BeautifulSoup`库来解析HTML页面。首先，`create_image_folder`函数接收一个关键词作为参数，并在桌面上创建一个以关键词命名的文件夹。如果文件夹已存在，则不会创建新的文件夹。然后，`download_images`函数接收关键词和文件夹路径作为参数。它使用关键词构建百度图片搜索的URL，并发送HTTP请求获取搜索结果页面。然后使用`BeautifulSoup`解析页面的HTML内容。在搜索结果页面中，图片的URL嵌入在`<img>`标签的`data-imgurl`属性中。函数遍历所有的图片标签，并下载每个图片到指定的文件夹路径中。下载的图片按照顺序命名，例如"1.jpg"，"2.jpg"等。最后，脚本获取用户输入的关键词，并调用`create_image_folder`和`download_images`函数来创建文件夹并下载图片。请注意，在运行脚本之前，确保已经安装了所需的库（`os`、`requests`和`bs4`），并且网络连接正常。

阅读全文

相关推荐

import sys import os import urllib from bs4 import BeautifulSoup

import reimport requestsfrom bs4 import BeautifulSoupimport t

import requests from bs4 import BeautifulSoup url = "https://movie.douban.com/top250" response = re

数分1.11Tableau安装及使用教程

软考信息系统运行管理员：涵盖信息系统运维、安全、架构及技术标准的多维考核

伪知识图谱：元路径引导检索与图内文本技术，助力RAG增强型LLM

大家在看

traffic.zip

基于机器视觉的工件识别和定位文献综述.docx

基于Audiowise PAU1603的TWS蓝牙耳机方案-综合文档

【微电网优化】基于粒子群优化IEEE经典微电网结构附matlab代码.zip

SEW MDX61B 变频器IPOS配置说明PDF

最新推荐

数分1.11Tableau安装及使用教程

软考信息系统运行管理员：涵盖信息系统运维、安全、架构及技术标准的多维考核

伪知识图谱：元路径引导检索与图内文本技术，助力RAG增强型LLM

Cyclone IV硬件配置详细文档解析

【WinCC与Excel集成秘籍】：轻松搭建数据交互桥梁（必读指南）

华为模拟互联地址配置

Java游戏开发简易实现与地图控制教程

【超市销售数据深度分析】：从数据库挖掘商业价值的必经之路

在ubuntu中安装ros时出现updating datebase of manual pages...怎么解决

Laravel Monobullet Monolog处理与Pushbullet API通知集成