python爬虫爬取图片脚本
时间: 2024-05-12 14:12:30 浏览: 172
Python爬虫是一种利用Python语言编写的程序,通过模拟人的浏览器行为获取网页数据,进而提取所需信息的技术。如果您想爬取图片,可以使用Python的requests库和beautifulsoup库进行实现。
以下是一个简单的爬取图片脚本示例:
```python
import requests
from bs4 import BeautifulSoup
# 请求页面
url = "https://www.example.com"
html = requests.get(url).text
# 解析页面
soup = BeautifulSoup(html, "html.parser")
img_tags = soup.find_all("img")
# 下载图片
for img in img_tags:
try:
img_url = img["src"]
img_data = requests.get(img_url).content
with open("image/" + img_url.split("/")[-1], "wb") as f:
f.write(img_data)
print("下载成功:" + img_url)
except Exception as e:
print("下载失败:" + img_url + ",错误信息:" + str(e))
```
以上脚本通过requests库请求页面,使用beautifulsoup库解析页面,并通过循环遍历每一个img标签来获取图片地址。接着,使用requests库下载每一个图片,并将其保存到本地。
阅读全文