简述如何使用python编写一个简单的爬虫程序,,获取指定网站上的图片并保存到本地
时间: 2024-06-09 10:07:19 浏览: 90
爬虫_python_一款某网站上面所有的写真图片的程序
下面是一个简单的 Python 爬虫程序,用于获取指定网站上的图片并保存到本地。需要使用 urllib 和 BeautifulSoup 库。
```python
import urllib.request
from bs4 import BeautifulSoup
# 定义要爬取的网页地址
url = "http://example.com"
# 请求网页并读取内容
response = urllib.request.urlopen(url)
html = response.read()
# 解析网页内容,获取所有图片链接
soup = BeautifulSoup(html, "html.parser")
images = soup.find_all("img")
# 遍历图片链接并下载保存到本地
for img in images:
img_url = url + img["src"]
filename = img["src"].split("/")[-1]
urllib.request.urlretrieve(img_url, filename)
```
该程序先请求指定网页并读取网页内容,然后使用 BeautifulSoup 库解析网页内容,获取所有图片链接。最后遍历图片链接,并使用 urllib 库下载并保存到本地。其中,img["src"] 表示图片链接,filename 表示保存到本地的文件名。
阅读全文