首页使用python爬虫爬取“https://www.chzc.edu.cn/info/1024/66328.htm”中图片

使用python爬虫爬取“https://www.chzc.edu.cn/info/1024/66328.htm”中图片

时间: 2023-10-31 12:19:55 浏览: 157

爬虫_python_一款抓取整个网站的图片程序

自研程序抓取整个网站的图片的python程序

好的，可以使用Python的requests和BeautifulSoup库来实现爬取图片的功能。以下是实现的代码： ```python import requests from bs4 import BeautifulSoup url = "https://www.chzc.edu.cn/info/1024/66328.htm" response = requests.get(url) soup = BeautifulSoup(response.content, "html.parser") # 找到所有的图片标签 img_tags = soup.find_all("img") # 遍历图片标签并下载图片 for img_tag in img_tags: img_url = img_tag["src"] img_name = img_url.split("/")[-1] img_response = requests.get(img_url) with open(img_name, "wb") as f: f.write(img_response.content) ``` 解释一下代码：首先，我们使用requests库获取网页的HTML代码。然后，使用BeautifulSoup库对HTML代码进行解析。接着，我们使用find_all方法找到所有的图片标签。在这个例子中，该网页只有一张图片，所以img_tags列表中只有一个元素。最后，我们遍历图片标签并使用requests库下载图片。图片的文件名可以通过图片URL中的最后一个斜杠后的字符串获得。图片保存在当前目录下。希望这个代码可以帮到你。

阅读全文