python爬虫爬取图片
时间: 2023-11-08 13:19:07 浏览: 92
可以使用 Python 的 requests 库和 BeautifulSoup 库来实现爬取图片的功能。
首先,需要从目标网页中找到图片的 URL 地址。可以使用 BeautifulSoup 库来解析 HTML 页面,找到其中的图片链接。
然后,使用 requests 库来下载图片。可以使用 get() 方法来获取图片,然后使用 open() 方法将图片保存到本地。
下面是一个简单的示例代码:
```python
import requests
from bs4 import BeautifulSoup
url = 'https://example.com'
response = requests.get(url)
soup = BeautifulSoup(response.content, 'html.parser')
images = soup.find_all('img')
for image in images:
image_url = image['src']
filename = image_url.split('/')[-1]
with open(filename, 'wb') as f:
f.write(requests.get(image_url).content)
```
其中,`find_all()` 方法用于查找所有的图片,`image['src']` 获取图片的 URL 地址,`split('/')[-1]` 获取图片的文件名,`open()` 方法将图片保存到本地。
需要注意的是,有些网站可能会对爬虫进行限制,需要添加一些额外的代码来模拟浏览器行为,避免被网站封禁。
阅读全文