首页Python爬取图片项目代码

Python爬取图片项目代码

时间: 2024-06-18 10:01:56 浏览: 185

python爬取图片,源代码

利用该爬虫可以爬取相关网页的图片，可以修改url，下载后的图片可以修改后缀格式，用图片打开软件打开。

在Python中，使用BeautifulSoup和requests库进行网页爬虫并下载图片是一个常见的任务。以下是一个简单的例子，展示如何爬取网页上的图片并保存到本地： ```python import requests from bs4 import BeautifulSoup import os # 定义目标URL和保存图片的目录 url = "https://example.com" # 替换为你要爬取的图片所在的网页链接 save_dir = "images" # 图片保存的本地目录 # 如果目录不存在，创建它 if not os.path.exists(save_dir): os.makedirs(save_dir) # 使用requests获取网页内容 response = requests.get(url) html_content = response.text # 使用BeautifulSoup解析HTML soup = BeautifulSoup(html_content, 'html.parser') # 查找所有的img标签 img_tags = soup.find_all('img') # 遍历每个图片标签，获取src属性（图片链接） for img_tag in img_tags: img_url = img_tag['src'] # 构建完整的图片下载URL full_img_url = url + img_url # 下载图片并保存 response_img = requests.get(full_img_url) file_name = os.path.join(save_dir, os.path.basename(img_url)) # 获取图片文件名 with open(file_name, 'wb') as f: f.write(response_img.content) #

阅读全文