正则匹配 筛选p标签之外的
时间: 2023-08-10 20:17:49 浏览: 112
您好!如果您想要使用正则表达式筛选掉 HTML 中的 p 标签,可以尝试使用以下正则表达式:
```
<(?!p\b)[^>]*>.*?</[^>]+>
```
这个正则表达式将匹配除了 p 标签以外的所有 HTML 标签,并将标签及其内容全部匹配出来。您可以将其与 Python 中的 re 模块一起使用,例如:
```python
import re
html = "<p>Hello, world!</p><div>Some other content</div><span>More content</span>"
pattern = re.compile(r'<(?!p\b)[^>]*>.*?</[^>]+>')
result = pattern.findall(html)
print(result)
```
输出结果会是:
```
['<div>Some other content</div>', '<span>More content</span>']
```
这样,您就可以筛选掉 HTML 中的 p 标签,得到其他标签的内容了。
阅读全文