springboot过滤字符串里所有的html标签获取纯文本
时间: 2024-01-01 18:06:36 浏览: 138
过滤含html标签的字符串
您可以使用Jsoup和正则表达式来解决这个问题。首先引入Jsoup依赖,然后创建一个方法来过滤HTML标签,如下所示:
```java
import org.jsoup.Jsoup;
import org.jsoup.safety.Whitelist;
import org.springframework.web.util.HtmlUtils;
public String filterHtml(String html) {
String text = Jsoup.clean(html, Whitelist.none());
text = HtmlUtils.htmlUnescape(text);
text = text.replaceAll("\\<.*?\\>", "");
return text;
}
```
该方法首先使用Jsoup将HTML转换为纯文本,然后使用HtmlUtils.htmlUnescape将实体字符还原,最后使用正则表达式去除所有的HTML标签。您可以将该方法添加到一个过滤器中,以在Spring Boot中过滤所有HTML标签。
阅读全文