python正则化爬图片
时间: 2023-10-05 11:11:13 浏览: 141
Python正则表达式在爬取网页图片时非常实用。你可以使用re模块中的findall方法来匹配网页源代码中的图片链接。首先,你需要使用requests库获取网页源代码,然后使用正则表达式匹配图片链接。下面是一个示例代码:
```python
import re
import requests
# 获取网页源代码
url = '网页地址'
response = requests.get(url)
content = response.text
# 使用正则表达式匹配图片链接
pattern = r'<img src="(.*?)"'
image_urls = re.findall(pattern, content)
# 下载图片
for image_url in image_urls:
response = requests.get(image_url)
with open('图片保存路径', 'wb') as f:
f.write(response.content)
```
以上代码中,你需要将'网页地址'替换为你要爬取的网页地址,'图片保存路径'替换为你要保存图片的路径。运行代码后,就可以将网页中的所有图片下载到本地。
阅读全文