爬取https://ys.mihoyo.com/main/manga的漫画并下载
时间: 2023-12-15 11:07:28 浏览: 256
KT-Manga-Downloader
为了爬取该网站上的漫画,我们需要使用 Python 的 requests 和 BeautifulSoup 库。
首先,我们需要发送请求并获取网页内容。然后,我们可以使用 BeautifulSoup 库来解析网页内容,并找到我们需要的漫画图片所在的标签。
下面是一个简单的程序来实现这个任务:
```python
import requests
from bs4 import BeautifulSoup
import os
# 创建保存漫画图片的文件夹
if not os.path.exists('manga'):
os.mkdir('manga')
# 发送请求并获取网页内容
url = 'https://ys.mihoyo.com/main/manga'
response = requests.get(url)
html = response.text
# 解析网页内容
soup = BeautifulSoup(html, 'html.parser')
# 找到漫画图片所在的标签
img_tags = soup.find_all('img', class_='comic-image')
# 下载漫画图片
for i, img_tag in enumerate(img_tags):
img_url = img_tag['data-src']
img_data = requests.get(img_url).content
with open(f'manga/{i}.jpg', 'wb') as f:
f.write(img_data)
```
这个程序会在当前目录下创建一个名为 `manga` 的文件夹,并将所有漫画图片下载到该文件夹中。你可以根据自己的需要修改文件夹名和图片文件名的格式。
阅读全文