用python写一个爬取图片的爬虫
时间: 2023-03-04 07:55:53 浏览: 29
很高兴为您解答!爬取图片的爬虫可以使用Python语言编写,可以通过调用urllib库中的urlretrieve()函数来获取图片,可以参考以下代码:
import urllib.request
url = 'http://example.com/image.png'
urllib.request.urlretrieve(url, 'image.png')
相关问题
使用python写一个爬取百度图片的爬虫
好的,以下是使用Python编写爬取百度图片的爬虫的代码:
```python
import requests
import re
def get_img_urls(keyword, num):
imgs = []
for i in range(num):
url = f'https://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&word={keyword}&pn={i * 30}&rn=30'
response = requests.get(url)
img_urls = re.findall(r'"thumbURL":"(.*?)",', response.text)
imgs += img_urls
return imgs
def download_imgs(keyword, num):
img_urls = get_img_urls(keyword, num)
for i, url in enumerate(img_urls):
response = requests.get(url)
with open(f'{keyword}_{i}.jpg', 'wb') as f:
f.write(response.content)
print(f'Saved {keyword}_{i}.jpg')
if __name__ == '__main__':
download_imgs('猫', 10)
```
这个爬虫可以通过搜索关键词来爬取百度图片,并下载到本地。
用Python写一个爬取pixiv网站图片的爬虫
好的,以下是一个简单的爬取pixiv网站图片的Python爬虫:
```python
import requests
from bs4 import BeautifulSoup
import os
# 图片保存路径
save_path = "./pixiv_images"
# 爬取页面的URL
url = "https://www.pixiv.net/ranking.php"
# 请求头信息
headers = {
"Referer": "https://www.pixiv.net/",
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3"}
# 发送请求,获取页面内容
response = requests.get(url, headers=headers)
# 解析HTML
soup = BeautifulSoup(response.text, "html.parser")
# 获取图片链接
img_tags = soup.select("img[src^='https://i.pximg.net']")
# 创建文件夹
if not os.path.exists(save_path):
os.makedirs(save_path)
# 下载图片
for i, img_tag in enumerate(img_tags):
img_url = img_tag["src"]
response = requests.get(img_url, headers=headers)
with open(os.path.join(save_path, f"pixiv_{i}.jpg"), "wb") as f:
f.write(response.content)
print("图片下载完成!")
```
该爬虫使用requests库发送HTTP请求,使用BeautifulSoup库解析HTML,使用os库创建文件夹,遍历图片链接并下载图片。请注意,该爬虫只是一个简单的示例,并不一定能够爬取所有的pixiv图片。
阅读全文