正则 去掉 html 中的 头部标签 和 from
时间: 2023-05-12 07:07:11 浏览: 73
可以使用以下正则表达式来去掉 HTML 中的头部标签和 from:
```python
import re
html = "<html><head><title>Test</title></head><body><p>Content</p></body></html>"
clean_html = re.sub(r"<(head|title|meta|script)[^>]*>.*?</\1>", "", html)
clean_html = re.sub(r"from:", "", clean_html)
print(clean_html)
```
输出结果为:
```
<body><p>Content</p></body></html>
```
相关问题
java 正则去除所有的html标签
您可以使用Java中的正则表达式来去除HTML标签。以下是一个示例代码,可以帮助您实现这个功能:
```java
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class HtmlTagRemover {
private static final String HTML_TAG_PATTERN = "<[^>]+>";
public static String removeHtmlTags(String input) {
if (input == null) {
return null;
}
Pattern pattern = Pattern.compile(HTML_TAG_PATTERN);
Matcher matcher = pattern.matcher(input);
return matcher.replaceAll("");
}
}
```
以上代码中,我们定义了一个正则表达式 `"<[^>]+>"` 用来匹配所有的HTML标签。然后我们使用 `Pattern` 和 `Matcher` 类来查找和替换这些标签。最后返回没有HTML标签的字符串。
js 正则去掉html代码中的img标签
可以使用如下的正则表达式:
```javascript
str = str.replace(/<img.*?>/g, "");
```
其中,`str`为待处理的html代码字符串,`.replace()`方法用来替换字符串中匹配正则表达式的部分,`<img.*?>`匹配所有的img标签及其内部内容。具体的regexp可以根据实际情况进行适当的调整。