正则表达式提取http
时间: 2023-09-29 17:03:00 浏览: 176
python使用正则表达式提取网页URL的方法
您可以使用以下正则表达式来提取HTTP:
```
(http|https):\/\/[a-zA-Z0-9\-\.]+\.[a-zA-Z]{2,}(\/\S*)?
```
这个正则表达式包含两个组:
1. 第一个组匹配HTTP或HTTPS协议。
2. 第二个组匹配域名和路径。
在Python中使用正则表达式可以这样写:
```python
import re
text = "Here is a sample text with a http://www.example.com link"
pattern = "(http|https):\/\/[a-zA-Z0-9\-\.]+\.[a-zA-Z]{2,}(\/\S*)?"
urls = re.findall(pattern, text)
print(urls)
```
输出:
```
[('http', '://www.example.com')]
```
请注意,这个正则表达式可能不能匹配所有的URL。在实际使用中,您可以根据自己的需求修改或编写更复杂的正则表达式。
阅读全文