Python中爬取漫画
时间: 2024-02-16 18:56:21 浏览: 67
大佬用python爬取网站漫画 内部课程
Python可以使用第三方库requests和BeautifulSoup来爬取网页上的漫画。具体步骤如下:
1. 使用requests库发送HTTP请求,获取网页的HTML代码。
2. 使用BeautifulSoup库解析HTML代码,提取出漫画的图片链接。
3. 使用requests库下载漫画图片,并保存到本地。
下面是一个简单的示例代码:
```python
import requests
from bs4 import BeautifulSoup
import os
def download_comic(url, path):
# 发送HTTP请求,获取HTML代码
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
# 提取漫画的图片链接
img_tags = soup.find_all('img', class_='comicimg')
img_urls = [tag['src'] for tag in img_tags]
# 下载漫画图片
for i, url in enumerate(img_urls):
response = requests.get(url)
with open(os.path.join(path, f'{i}.jpg'), 'wb') as f:
f.write(response.content)
if __name__ == '__main__':
key = input('请输入你要下载的漫画:')
data_path = r'D:/数据小刀/爬虫④/漫画/{}/'.format(key)
if not os.path.exists(data_path):
# 根据用户输入的漫画名称创建文件夹
os.mkdir(data_path)
url = f'https://www.kanman.com/api/getsortlist/?search_key={key}'
download_comic(url, data_path)
```
阅读全文