Python 爬取图片
时间: 2023-11-05 10:22:25 浏览: 108
你可以使用Python中的requests库和BeautifulSoup库来爬取图片。下面是一个简单的示例代码,演示了如何使用这两个库来爬取图片:
```python
import requests
from bs4 import BeautifulSoup
def download_image(url):
response = requests.get(url, stream=True)
file_name = url.split("/")[-1] # 使用图片URL中的最后一部分作为文件名
with open(file_name, 'wb') as file:
for chunk in response.iter_content(chunk_size=128):
file.write(chunk)
print(f"图片已下载: {file_name}")
def crawl_images(url):
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
img_tags = soup.find_all('img')
for img_tag in img_tags:
img_url = img_tag['src']
if img_url.startswith('http'):
download_image(img_url)
url = 'https://example.com' # 替换为你要爬取图片的网页URL
crawl_images(url)
```
将`url`变量替换为你想要爬取图片的网页URL。上述代码会下载该网页中所有以`<img>`标签表示的图片,并保存到当前目录下。
需要注意的是,爬取图片涉及到的法律和道德问题,你应该获得图片的合法使用权或遵守网站的使用规定。另外,爬取网站时请尊重网站的robots.txt文件,避免对网站造成过大的负担。
阅读全文