python中网页document类型如何下载成图片
时间: 2024-12-23 21:23:39 浏览: 10
在Python中,你可以使用第三方库如`requests`和`BeautifulSoup`结合`PIL`或者`selenium`来下载网页中的图片并保存到本地。这里是一个基本的示例,假设你想从URL下载HTML页面中的所有图片:
```python
import requests
from bs4 import BeautifulSoup
from PIL import Image
# 定义目标URL
url = 'http://example.com'
# 使用requests获取网页内容
response = requests.get(url)
html_content = response.text
# 使用BeautifulSoup解析HTML
soup = BeautifulSoup(html_content, 'lxml')
# 找到所有的img标签
img_tags = soup.find_all('img')
# 下载图片
for img_tag in img_tags:
# 获取图片的src属性(链接)
img_url = img_tag['src']
# 构建完整的下载URL
full_img_url = url + img_url if not img_url.startswith('http') else img_url
# 发送请求下载图片
img_response = requests.get(full_img_url)
# 将响应转换为Bytes流
image_data = img_response.content
# 使用PIL创建一个新的Image对象,并保存到本地
with open(f'downloaded_{img_url.split("/")[-1]}', 'wb') as f:
img = Image.open(BytesIO(image_data))
img.save(f)
阅读全文