如何使用python爬取网页图片
时间: 2023-09-20 14:13:02 浏览: 107
使用Python爬虫库requests和BeautifulSoup可以很方便地实现爬取网页图片的功能。具体步骤如下:
1. 引入requests库和BeautifulSoup库:
```
import requests
from bs4 import BeautifulSoup
```
2. 发送请求获取网页内容:
```
url = "http://example.com"
response = requests.get(url)
```
3. 使用BeautifulSoup解析网页内容,获取所有的图片标签:
```
soup = BeautifulSoup(response.text, 'html.parser')
img_tags = soup.find_all('img')
```
4. 遍历所有的图片标签,获取图片的链接,并使用requests库下载图片:
```
for img in img_tags:
img_url = img.get('src')
if img_url.startswith('http'):
img_response = requests.get(img_url)
with open('image.jpg', 'wb') as f:
f.write(img_response.content)
```
上述代码中,我们遍历所有的图片标签,使用get()方法获取图片的链接,判断链接是否以http开头,如果是,使用requests库发送请求获取图片内容,然后将图片内容写入本地文件。
阅读全文