Python爬取图片项目代码
时间: 2024-06-18 10:01:56 浏览: 185
python爬取图片,源代码
在Python中,使用BeautifulSoup和requests库进行网页爬虫并下载图片是一个常见的任务。以下是一个简单的例子,展示如何爬取网页上的图片并保存到本地:
```python
import requests
from bs4 import BeautifulSoup
import os
# 定义目标URL和保存图片的目录
url = "https://example.com" # 替换为你要爬取的图片所在的网页链接
save_dir = "images" # 图片保存的本地目录
# 如果目录不存在,创建它
if not os.path.exists(save_dir):
os.makedirs(save_dir)
# 使用requests获取网页内容
response = requests.get(url)
html_content = response.text
# 使用BeautifulSoup解析HTML
soup = BeautifulSoup(html_content, 'html.parser')
# 查找所有的img标签
img_tags = soup.find_all('img')
# 遍历每个图片标签,获取src属性(图片链接)
for img_tag in img_tags:
img_url = img_tag['src']
# 构建完整的图片下载URL
full_img_url = url + img_url
# 下载图片并保存
response_img = requests.get(full_img_url)
file_name = os.path.join(save_dir, os.path.basename(img_url)) # 获取图片文件名
with open(file_name, 'wb') as f:
f.write(response_img.content)
#
阅读全文