java 正则去除所有的html标签
时间: 2023-10-12 09:17:37 浏览: 137
java去掉html标签 必须首先去掉双引号的正则.docx
您可以使用Java中的正则表达式来去除HTML标签。以下是一个示例代码,可以帮助您实现这个功能:
```java
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class HtmlTagRemover {
private static final String HTML_TAG_PATTERN = "<[^>]+>";
public static String removeHtmlTags(String input) {
if (input == null) {
return null;
}
Pattern pattern = Pattern.compile(HTML_TAG_PATTERN);
Matcher matcher = pattern.matcher(input);
return matcher.replaceAll("");
}
}
```
以上代码中,我们定义了一个正则表达式 `"<[^>]+>"` 用来匹配所有的HTML标签。然后我们使用 `Pattern` 和 `Matcher` 类来查找和替换这些标签。最后返回没有HTML标签的字符串。
阅读全文