python编写爬取图片
时间: 2023-10-17 15:09:36 浏览: 73
以下是一个简单的Python代码,用于爬取指定网站的图片并将其保存在本地:
```python
import requests
from bs4 import BeautifulSoup
import os
url = 'https://www.example.com' # 指定要爬取的网站地址
save_folder = 'images' # 指定要保存图片的文件夹名称
if not os.path.exists(save_folder):
os.makedirs(save_folder)
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
img_tags = soup.find_all('img')
for img in img_tags:
img_url = img.get('src')
if img_url.startswith('http'):
response = requests.get(img_url)
filename = os.path.join(save_folder, img_url.split('/')[-1])
with open(filename, 'wb') as f:
f.write(response.content)
print(f'Saved {filename}')
```
该代码使用requests库和BeautifulSoup库来获取网站的HTML代码,并从中查找所有的img标签。对于每个img标签,它会提取其src属性并使用requests库下载该图片,然后将其保存在指定的文件夹中。最后,它会打印出已保存的每个文件的名称。注意,这个代码只能爬取图片,如果需要爬取其他类型的文件,需要作出相应的修改。
阅读全文