python正则匹配html标签
时间: 2023-11-03 08:59:52 浏览: 296
Python正则表达式匹配HTML页面编码
要使用正则表达式匹配HTML标签,可以使用以下代码:
```python
import re
def match_html_tags(html):
pattern = r"<.*?>"
tags = re.findall(pattern, html)
return tags
html = "<div><p>Hello, world!</p></div>"
tags = match_html_tags(html)
print(tags)
```
输出结果为:`['<div>', '<p>', '</p>', '</div>']`。
相关问题:
1. 如何匹配HTML标签中的属性?
2. 如何提取HTML中的文本内容,而不包括标签?
3. 如何替换HTML标签
阅读全文