python爬虫获取网页中的图片代码
时间: 2024-10-25 19:05:20 浏览: 28
python爬虫获取网页图片代码
在Python中,我们可以使用`requests`库来发送HTTP请求获取网页内容,然后用`BeautifulSoup`库解析HTML,提取出图片链接。下面是一个基本的示例,展示如何抓取网页中的图片:
```python
import requests
from bs4 import BeautifulSoup
import os
def get_images(url):
# 发送GET请求获取网页内容
response = requests.get(url)
# 检查请求是否成功
if response.status_code == 200:
# 使用BeautifulSoup解析HTML
soup = BeautifulSoup(response.text, 'html.parser')
# 查找所有的img标签
img_tags = soup.find_all('img')
# 提取src属性,即图片链接
image_links = [img['src'] for img in img_tags]
# 创建目标目录存储图片,如果不存在则创建
save_dir = 'images'
if not os.path.exists(save_dir):
os.makedirs(save_dir)
# 下载并保存图片到指定目录
for link in image_links:
try:
img_data = requests.get(link).content
with open(os.path.join(save_dir, link.split('/')[-1]), 'wb') as f:
f.write(img_data)
except Exception as e:
print(f"下载图片 {link} 出错: {e}")
# 使用函数抓取特定网页的图片
get_images('https://example.com') # 替换为你想要抓取的网址
阅读全文