pycharm如何爬取某个链接的图片并保存到E:\images文件夹
时间: 2024-12-25 22:32:06 浏览: 6
在PyCharm中使用Python进行网页图片爬取并保存,通常我们会使用requests库获取网页内容,然后BeautifulSoup解析HTML提取图片链接,最后使用urllib或者os模块下载并保存图片。以下是简单的步骤:
1. 安装所需库:
- 如果还没有安装,首先需要打开终端(在PyCharm中是Terminal或Console),输入`pip install requests beautifulsoup4`安装这两个库。
2. 编写Python脚本:
```python
import os
import requests
from bs4 import BeautifulSoup
# 指定要爬取的URL和目标文件夹路径
url = "http://example.com" # 替换为你想爬取的图片页面
output_folder = "E:/images"
if not os.path.exists(output_folder): # 判断文件夹是否存在,不存在则创建
os.makedirs(output_folder)
def download_image(image_url):
response = requests.get(image_url)
if response.status_code == 200: # 确保请求成功
file_name = os.path.join(output_folder, image_url.split("/")[-1])
with open(file_name, 'wb') as f:
f.write(response.content)
print(f"Image saved to {file_name}")
# 使用BeautifulSoup解析HTML并找到所有img标签的src属性
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
image_tags = soup.find_all('img')
for img_tag in image_tags:
image_url = img_tag['src']
download_image(image_url)
阅读全文