Python爬图片代码
时间: 2024-10-16 11:00:51 浏览: 31
Python爬虫开源项目代码
在Python中爬取图片通常涉及网络请求、HTML解析以及文件操作等步骤。这里提供一个简单的BeautifulSoup库配合requests库的例子,用于爬取网页上的图片链接:
```python
import requests
from bs4 import BeautifulSoup
import os
# 定义要抓取的URL
url = 'https://www.example.com' # 替换为你想要爬取的网站地址
# 发送GET请求获取页面内容
response = requests.get(url)
# 使用BeautifulSoup解析HTML内容
soup = BeautifulSoup(response.text, 'html.parser')
# 查找所有的图片标签,如img
img_tags = soup.find_all('img')
# 创建保存图片的目录,如果不存在
if not os.path.exists('images'):
os.makedirs('images')
# 遍历每个图片标签,获取src属性的链接并下载
for img_tag in img_tags:
img_url = img_tag['src']
# 确保图片URL是以'http'或'https'开头的,如果不是则添加协议
if not img_url.startswith(('http:', 'https:')):
img_url = f'http:{img_url}'
# 下载图片到本地
with open(os.path.join('images', img_url.split('/')[-1]), 'wb') as f:
response = requests.get(img_url)
f.write(response.content)
阅读全文