用Python写一个爬取三国杀武将图片的爬虫
时间: 2024-06-10 13:05:43 浏览: 218
python爬虫,爬取图片
好的,以下是一个简单的 Python 爬虫代码,可以爬取三国杀官方网站中的武将图片:
```python
import os
import requests
from bs4 import BeautifulSoup
# 设置要爬取的页面 URL 和本地图片保存目录
url = 'https://www.sanguosha.com/heroes/'
save_dir = './heroes/'
# 如果保存目录不存在,就创建它
if not os.path.exists(save_dir):
os.makedirs(save_dir)
# 发送 HTTP 请求,获取页面 HTML 内容
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
# 从 HTML 中提取所有武将图片的 URL
hero_imgs = [img['src'] for img in soup.select('.hero_picture img')]
# 遍历所有武将图片的 URL,下载图片并保存到本地
for i, hero_img in enumerate(hero_imgs):
response = requests.get(hero_img, stream=True)
filename = os.path.join(save_dir, f'{i+1}.jpg')
with open(filename, 'wb') as f:
for chunk in response.iter_content(chunk_size=1024):
if chunk:
f.write(chunk)
```
这个爬虫使用了 requests 库发送 HTTP 请求,使用了 BeautifulSoup 库解析 HTML 内容,然后从 HTML 中提取出所有武将图片的 URL,遍历 URL 并使用 requests 库下载图片到本地。如果没有本地保存目录,会自动创建它。
阅读全文