python提取网页中图片代码
时间: 2024-09-18 07:05:08 浏览: 40
在Python中,我们可以使用BeautifulSoup库配合requests库来抓取网页中的图片。以下是一个简单的示例,展示如何从HTML中提取所有的`<img>`标签并下载图片:
```python
import requests
from bs4 import BeautifulSoup
import os
def download_images(url):
# 获取网页内容
response = requests.get(url)
# 解析HTML内容
soup = BeautifulSoup(response.text, 'html.parser')
# 找到所有<img>标签
img_tags = soup.find_all('img')
# 定义下载路径(这里假设在当前目录下)
save_dir = "images"
if not os.path.exists(save_dir):
os.makedirs(save_dir)
# 遍历图片标签,获取src属性并下载
for img_tag in img_tags:
img_url = img_tag.get('src') or img_tag.get('data-src') # 处理一些现代网站可能使用的"data-src"代替"src"
if img_url:
img_name = os.path.join(save_dir, os.path.basename(img_url))
with open(img_name, 'wb') as f:
img_data = requests.get(img_url).content
f.write(img_data)
print(f'Successfully downloaded {img_name}')
# 使用函数
download_images('https://example.com') # 将'https://example.com'替换为你想抓取的网页地址
```
阅读全文