beautifulsoup怎么下载图片
时间: 2023-11-29 11:49:18 浏览: 65
要使用BeautifulSoup下载图片,你可以使用urllib库中的urlretrieve()函数。首先,你需要找到图片的URL,然后使用urlretrieve()函数将其下载到指定的文件夹中。下面是一个示例代码:
```python
from bs4 import BeautifulSoup
import urllib.request
# 获取页面信息
def getHtml(url):
html = urllib.request.urlopen(url).read()
return html
url = 'https://movie.douban.com/celebrity/1315477/photos/'
html = getHtml(url)
bs = BeautifulSoup(html, "html.parser")
# 缩进格式
for item in bs.find_all("img"):
img_path = item.get('src')
if img_path.startswith('https://'):
urllib.request.urlretrieve(img_path, 'img.jpg')
```
在这个示例中,我们首先使用getHtml()函数获取页面的HTML内容。然后,使用BeautifulSoup解析HTML内容。接下来,我们遍历所有的img标签,获取图片的URL。如果URL以'https://'开头,我们就使用urlretrieve()函数将图片下载到当前目录下的img.jpg文件中。
请注意,你需要根据你的实际需求修改代码中的URL和文件名。此外,你还需要确保你的代码中已经导入了urllib库和BeautifulSoup库。
#### 引用[.reference_title]
- *1* *3* [python3 爬虫相关学习7:使用 BeautifulSoup下载网页图片到本地文件夹](https://blog.csdn.net/xuemanqianshan/article/details/131073618)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down1,239^v3^insert_chatgpt"}} ] [.reference_item]
- *2* [python3 beautifulsoup解析网页下载图片](https://blog.csdn.net/w5688414/article/details/105556865)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down1,239^v3^insert_chatgpt"}} ] [.reference_item]
[ .reference_list ]
阅读全文