python爬虫爬取一个网站上的一张照片
时间: 2024-09-30 10:06:48 浏览: 23
python爬虫系列Selenium定向爬取虎扑篮球图片详解
Python爬虫通过requests库发送HTTP请求获取网页内容,然后使用BeautifulSoup或其他解析库(如lxml)解析HTML结构,找到图片URL。以下是简单的步骤:
1. **导入所需库**:
```python
import requests
from bs4 import BeautifulSoup
```
2. **发送GET请求并获取网页源码**:
```python
url = '目标图片所在的网站地址'
response = requests.get(url)
```
3. **检查响应状态码**:
```python
if response.status_code == 200:
# 网页成功加载
else:
# 处理错误情况
```
4. **解析HTML获取图片链接**:
```python
soup = BeautifulSoup(response.text, 'html.parser')
img_tag = soup.find('img') # 找到第一个img标签
img_url = img_tag['src'] if img_tag else None
```
5. **保存图片**:
```python
if img_url:
with open('下载的图片名.jpg', 'wb') as f:
img_data = requests.get(img_url).content
f.write(img_data)
```
请注意,实际操作时要遵守网站的robots.txt规则,尊重版权,并且处理可能出现的反爬机制。
阅读全文