首页Python中爬取漫画

Python中爬取漫画

时间: 2024-02-16 18:56:21 浏览: 67

大佬用python爬取网站漫画内部课程

Python可以使用第三方库requests和BeautifulSoup来爬取网页上的漫画。具体步骤如下： 1. 使用requests库发送HTTP请求，获取网页的HTML代码。 2. 使用BeautifulSoup库解析HTML代码，提取出漫画的图片链接。 3. 使用requests库下载漫画图片，并保存到本地。下面是一个简单的示例代码： ```python import requests from bs4 import BeautifulSoup import os def download_comic(url, path): # 发送HTTP请求，获取HTML代码 response = requests.get(url) soup = BeautifulSoup(response.text, 'html.parser') # 提取漫画的图片链接 img_tags = soup.find_all('img', class_='comicimg') img_urls = [tag['src'] for tag in img_tags] # 下载漫画图片 for i, url in enumerate(img_urls): response = requests.get(url) with open(os.path.join(path, f'{i}.jpg'), 'wb') as f: f.write(response.content) if __name__ == '__main__': key = input('请输入你要下载的漫画：') data_path = r'D:/数据小刀/爬虫④/漫画/{}/'.format(key) if not os.path.exists(data_path): # 根据用户输入的漫画名称创建文件夹 os.mkdir(data_path) url = f'https://www.kanman.com/api/getsortlist/?search_key={key}' download_comic(url, data_path) ```

阅读全文