首页挑选页面，用requests库爬取文字内容，爬取其中的一个图片，并保存到D盘根目录

挑选页面，用requests库爬取文字内容，爬取其中的一个图片，并保存到D盘根目录

时间: 2024-09-22 18:00:48 浏览: 37

在Python中，我们可以使用requests库来发送HTTP请求获取网页内容，然后利用BeautifulSoup库解析HTML并提取所需的图片链接。这里是一个简单的步骤：首先，你需要安装`requests`和`beautifulsoup4`库，如果还没有安装，可以使用以下命令： ```bash pip install requests beautifulsoup4 ``` 然后，编写Python脚本来实现这个功能： ```python import os import requests from bs4 import BeautifulSoup def download_image(url, save_path): response = requests.get(url) if response.status_code == 200: with open(save_path, 'wb') as f: f.write(response.content) print(f"Image downloaded successfully: {save_path}") else: print("Failed to download image.") def main(): # 目标网页URL url = "https://example.com" # 替换为你想要抓取的页面URL # 图片路径，这里指定保存在D盘根目录下 save_dir = "D:\\" img_tag = 'img' # 预计图片标签名，根据实际页面结构调整 soup = BeautifulSoup(requests.get(url).text, 'html.parser') # 找到第一个img标签 img_url = soup.find(img_tag)['src'] # 确保目录存在 if not os.path.exists(save_dir): os.makedirs(save_dir) # 获取完整图片路径并下载 img_save_path = os.path.join(save_dir, os.path.basename(img_url)) download_image(img_url, img_save_path) if __name__ == "__main__": main() ``` 请将上述代码中的`url`变量替换为你要爬取的实际网页地址。这个脚本会尝试下载页面的第一个`<img>`标签对应的图片。如果你需要特定条件下的图片，可以根据实际HTML结构进行修改。

阅读全文

最新推荐

挑选页面，用requests库爬取文字内容，爬取其中的一个图片，并保存到D盘根目录

相关推荐

使用Xpath爬取36氪动态页面并保存到Excel

利用bs4-requests实现Python图片爬取技巧

Python IDLE利用requests库爬取网页并检测HTTP状态码

python requests库爬取豆瓣电视剧数据并保存到本地详解

python3使用requests模块爬取页面内容的实战演练

使用selenium和requests库爬取新浪微博

python使用requests库爬取拉勾网招聘信息的实现

Python基于requests库爬取网站信息

requests库爬取百度主页.txt

Requests库爬取个人的所有Git项目

Python使用requests、urllib库爬取百度图片，输入搜索下载的图片关键词即可爬取需要的图片

requests库爬取信息安全漏洞门户网站的CVE漏洞信息.zip

python 使用基础requests 去爬取网页上面的图片并下载

使用requests爬取百度图片并显示

使用requests库爬取图片

使用requests库爬取学校主页； 将爬取的html文字内容存储在D盘的xynu.txt文档里

关于requests库特点描述正确的是？ （6 分） A． requests库适合小规模爬取 B． requests库适合数据量小的操作 C． requests库爬取速度不敏感 D． requests库可以爬取网页，玩转网页

头哥使用 requests 库爬取静态网页

如何使用requests库爬取pdf网站数据

requests库如何爬取数据

最新推荐

Python使用xpath实现图片爬取

Python requests30行代码爬取知乎一个问题的所有回答

python爬取cnvd漏洞库信息的实例

Python爬取数据并实现可视化代码解析

python如何爬取网页中的文字

Angular实现MarcHayek简历展示应用教程

管理建模和仿真的文件

深入剖析：内存溢出背后的原因、预防及应急策略（专家版）

Java中如何对年月日时分秒的日期字符串作如下处理：如何日期分钟介于两个相连的半点之间，就将分钟数调整为前半点

Crossbow Spot最新更新 - 获取Chrome扩展新闻

使用requests库爬取学校主页；将爬取的html文字内容存储在D盘的xynu.txt文档里

关于requests库特点描述正确的是？（6 分） A． requests库适合小规模爬取 B． requests库适合数据量小的操作 C． requests库爬取速度不敏感 D． requests库可以爬取网页，玩转网页