使用requests库爬取图片
时间: 2023-10-23 07:48:13 浏览: 100
以下是使用requests库爬取图片的代码示例:
```python
import requests
import os
url = 'https://www.example.com/image.jpg'
response = requests.get(url)
if response.status_code == 200:
with open(os.path.basename(url), 'wb') as f:
f.write(response.content)
print('Image saved successfully.')
else:
print('Failed to fetch image.')
```
这段代码首先定义了要爬取的图片的URL,然后使用requests库发送GET请求获取图片。如果响应状态码为200,则将响应内容写入本地文件并打印成功信息,否则打印失败信息。其中`os.path.basename(url)`可以获取URL中的文件名,用于保存本地文件。
相关问题
用bs4和requests库爬取优美图库
以下是使用Python的requests和BeautifulSoup库爬取优美图库的示例代码:
```python
import requests
from bs4 import BeautifulSoup
url = 'https://www.umei.cc/meinvtupian/'
response = requests.get(url)
soup = BeautifulSoup(response.content, 'html.parser')
for img in soup.find_all('img'):
print(img.get('src'))
```
首先,我们定义了要爬取的网址,并使用requests库向该网址发送GET请求。然后,我们将响应内容传递给BeautifulSoup对象进行解析。
在这个例子中,我们使用了soup.find_all('img')来找到网页中所有的图片标签,然后使用img.get('src')获取每个图片标签中的src属性值(即图片链接)。
最后,我们可以将这些链接打印出来,或使用其他方法进行进一步处理。
挑选页面,用requests库爬取文字内容,爬取其中的一个图片,并保存到D盘根目录
在Python中,我们可以使用requests库来发送HTTP请求获取网页内容,然后利用BeautifulSoup库解析HTML并提取所需的图片链接。这里是一个简单的步骤:
首先,你需要安装`requests`和`beautifulsoup4`库,如果还没有安装,可以使用以下命令:
```bash
pip install requests beautifulsoup4
```
然后,编写Python脚本来实现这个功能:
```python
import os
import requests
from bs4 import BeautifulSoup
def download_image(url, save_path):
response = requests.get(url)
if response.status_code == 200:
with open(save_path, 'wb') as f:
f.write(response.content)
print(f"Image downloaded successfully: {save_path}")
else:
print("Failed to download image.")
def main():
# 目标网页URL
url = "https://example.com" # 替换为你想要抓取的页面URL
# 图片路径,这里指定保存在D盘根目录下
save_dir = "D:\\"
img_tag = 'img' # 预计图片标签名,根据实际页面结构调整
soup = BeautifulSoup(requests.get(url).text, 'html.parser')
# 找到第一个img标签
img_url = soup.find(img_tag)['src']
# 确保目录存在
if not os.path.exists(save_dir):
os.makedirs(save_dir)
# 获取完整图片路径并下载
img_save_path = os.path.join(save_dir, os.path.basename(img_url))
download_image(img_url, img_save_path)
if __name__ == "__main__":
main()
```
请将上述代码中的`url`变量替换为你要爬取的实际网页地址。这个脚本会尝试下载页面的第一个`<img>`标签对应的图片。如果你需要特定条件下的图片,可以根据实际HTML结构进行修改。
阅读全文