正则去除html标签
时间: 2023-11-09 21:50:37 浏览: 40
可以使用正则表达式来去除HTML标签。以下是一个示例代码:
```python
import re
def remove_html_tags(text):
clean = re.compile('<.*?>')
return re.sub(clean, '', text)
html_text = '<h1>Hello, World!</h1><p>This is a paragraph.</p>'
clean_text = remove_html_tags(html_text)
print(clean_text) # Output: Hello, World! This is a paragraph.
```
相关问题
js 正则去除html标签
可以使用正则表达式来去除 HTML 标签。下面是一个示例代码:
```javascript
function removeHtmlTags(str) {
return str.replace(/<[^>]+>/g, '');
}
var htmlString = '<p>Hello, <strong>world!</strong></p>';
var plainText = removeHtmlTags(htmlString);
console.log(plainText); // Output: "Hello, world!"
```
这里使用了 `replace` 函数和正则表达式 `/<[^>]+>/g`,它会匹配任何以 `<` 开头、以 `>` 结尾的字符串,并将其替换为空字符串。
正则去掉所有html 标签
可以使用正则表达式来去除 HTML 标签。以下是一个简单的正则表达式,可以匹配所有 HTML 标签并将其删除:
```python
import re
def remove_tags(text):
return re.sub(r'<[^>]*?>', '', text)
```
通过调用 remove_tags() 函数,并传递包含 HTML 标签的文本作为参数,可以删除所有 HTML 标签。例如:
```python
text_with_tags = '<p>Hello, <strong>world!</strong></p>'
text_without_tags = remove_tags(text_with_tags)
print(text_without_tags) # 输出: Hello, world!
```
这个函数会使用正则表达式 r'<[^>]*?>' 匹配所有 HTML 标签,并将其替换为空字符串,从而实现去除 HTML 标签的功能。