Python爬虫怎么抓图片代码
时间: 2024-10-08 07:25:04 浏览: 38
Python爬虫抓取指定网页图片代码实例
5星 · 资源好评率100%
在Python中,通过requests库获取网页内容,然后利用BeautifulSoup解析HTML,可以找到图片的URL。这里是一个简单的例子,假设我们想要抓取一个网页上的所有图片:
```python
import requests
from bs4 import BeautifulSoup
# 目标网址
url = 'http://example.com'
# 发送GET请求
response = requests.get(url)
# 检查请求是否成功
if response.status_code == 200:
# 使用BeautifulSoup解析HTML
soup = BeautifulSoup(response.text, 'html.parser')
# 找到所有的img标签,img标签通常包含src属性
img_tags = soup.find_all('img')
# 遍历每个img标签并保存图片URL
for img_tag in img_tags:
img_url = img_tag['src'] # 获取src属性的值,即图片链接
# 将图片下载保存到本地,这里需要第三方库如requests和PIL(Image)
# 例如使用`requests.get(img_url).content`
# 如果需要保存到文件,还需要另导入io模块,并指定保存路径,如:
# with open('path/to/save/image.jpg', 'wb') as f:
# f.write(requests.get(img_url).content)
else:
print(f"请求失败,状态码:{response.status_code}")
```
注意:实际操作中可能需要处理反爬策略(如验证码、cookies等),以及图片版权问题。另外,频繁抓取网站可能会对服务器造成压力,因此请遵守网站的Robots.txt协议。
阅读全文