正则 去掉 html 中的 头部标签 和 from 
时间: 2023-05-12 08:07:11 浏览: 43
可以使用以下正则表达式来去掉 HTML 中的头部标签和 from:
```python
import re
html = "<html><head><title>Test</title></head><body><p>Content</p></body></html>"
clean_html = re.sub(r"<(head|title|meta|script)[^>]*>.*?</\1>", "", html)
clean_html = re.sub(r"from:", "", clean_html)
print(clean_html)
```
输出结果为:
```
<body><p>Content</p></body></html>
```
相关问题
js 正则去掉html代码中的img标签
可以使用如下的正则表达式:
```javascript
str = str.replace(/<img.*?>/g, "");
```
其中,`str`为待处理的html代码字符串,`.replace()`方法用来替换字符串中匹配正则表达式的部分,`<img.*?>`匹配所有的img标签及其内部内容。具体的regexp可以根据实际情况进行适当的调整。
正则去掉所有html 标签
可以使用正则表达式来去除 HTML 标签。以下是一个简单的正则表达式,可以匹配所有 HTML 标签并将其删除:
```python
import re
def remove_tags(text):
return re.sub(r'<[^>]*?>', '', text)
```
通过调用 remove_tags() 函数,并传递包含 HTML 标签的文本作为参数,可以删除所有 HTML 标签。例如:
```python
text_with_tags = '<p>Hello, <strong>world!</strong></p>'
text_without_tags = remove_tags(text_with_tags)
print(text_without_tags) # 输出: Hello, world!
```
这个函数会使用正则表达式 r'<[^>]*?>' 匹配所有 HTML 标签,并将其替换为空字符串,从而实现去除 HTML 标签的功能。
相关推荐















