python正则表达式匹配图片
时间: 2023-06-21 08:03:58 浏览: 165
python 实现正则表达式匹配
可以使用正则表达式匹配常见的图片格式,例如:
```python
import re
# 匹配jpg、jpeg、png、gif格式的图片链接
pattern = r'https?://[^\s]*(?:jpg|jpeg|png|gif)'
text = '这是一张图片:https://www.example.com/test.jpg'
result = re.findall(pattern, text)
print(result) # 输出 ['https://www.example.com/test.jpg']
```
这里的正则表达式 `https?://[^\s]*(?:jpg|jpeg|png|gif)` 的含义是:
- `https?://`:匹配以 `http://` 或者 `https://` 开头的链接。
- `[^\s]*`:匹配链接中除空格之外的任意字符,可以匹配链接中的路径部分。
- `(?:jpg|jpeg|png|gif)`:非捕获组,匹配四种图片格式。
需要注意的是,这种方法只能匹配链接中的图片,如果要匹配网页中的实际图片,可以使用第三方库如 `BeautifulSoup` 或 `lxml`。
阅读全文