正则 匹配 html 标签 有多个连续 超链接的html
时间: 2023-05-26 13:01:19 浏览: 195
HTML的标签 a标签超链接
5星 · 资源好评率100%
文本怎么匹配?
A:可以使用正则表达式来匹配包含多个连续超链接的HTML文本,具体如下:
```
import re
html_text = '<p><a href="https://www.example.com">Link 1</a> <a href="https://www.example.com">Link 2</a></p>'
pattern = re.compile(r'<a\s.*?>.*?</a>\s*')
matches = pattern.findall(html_text)
print(matches)
```
这段代码首先定义了一个包含HTML文本的字符串变量`html_text`,然后使用正则表达式模式`r'<a\s.*?>.*?</a>\s*'`来匹配其中的超链接。这个正则表达式的含义是:
* `<a`:匹配以`<a`开头的标签;
* `\s.*?`:匹配空格和其他任意字符,带`?`表示非贪婪匹配;
* `>.*?</a>`:匹配标签内容,带`?`表示非贪婪匹配;
* `\s*`:匹配任意数量的空格。
最后使用`pattern.findall(html_text)`函数来返回所有匹配的字符串列表。在本例中,输出结果为`['<a href="https://www.example.com">Link 1</a> ', '<a href="https://www.example.com">Link 2</a>']`,表示匹配到了两个超链接。
阅读全文