正则去掉所有html 标签
时间: 2023-07-05 21:21:44 浏览: 230
去掉所有的html标签
4星 · 用户满意度95%
可以使用正则表达式来去除 HTML 标签。以下是一个简单的正则表达式,可以匹配所有 HTML 标签并将其删除:
```python
import re
def remove_tags(text):
return re.sub(r'<[^>]*?>', '', text)
```
通过调用 remove_tags() 函数,并传递包含 HTML 标签的文本作为参数,可以删除所有 HTML 标签。例如:
```python
text_with_tags = '<p>Hello, <strong>world!</strong></p>'
text_without_tags = remove_tags(text_with_tags)
print(text_without_tags) # 输出: Hello, world!
```
这个函数会使用正则表达式 r'<[^>]*?>' 匹配所有 HTML 标签,并将其替换为空字符串,从而实现去除 HTML 标签的功能。
阅读全文