java中删除字符串中的html标签 通过插件
时间: 2023-12-12 11:04:33 浏览: 79
清除字符串中的html标记
5星 · 资源好评率100%
在Java中删除字符串中的HTML标签,可以使用Jsoup插件。Jsoup是一种HTML解析器,它可以从HTML文档中提取和操作数据。以下是使用Jsoup删除HTML标签的示例代码:
```java
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class HtmlParser {
public static String removeHtmlTags(String html) {
Document document = Jsoup.parse(html);
Elements elements = document.getAllElements();
for (Element element : elements) {
if (!element.ownText().isEmpty()) {
element.replaceWith(new Element("text").text(element.ownText()));
} else {
element.remove();
}
}
return document.text();
}
public static void main(String[] args) {
String html = "<p>This is <b>bold</b> and <i>italic</i> text.</p>";
String plainText = removeHtmlTags(html);
System.out.println(plainText); // Output: This is bold and italic text.
}
}
```
在上面的示例中,`removeHtmlTags()`方法接受一个HTML字符串并返回一个不包含HTML标签的纯文本字符串。这个方法使用Jsoup解析HTML文档,并使用`getAllElements()`方法获取所有元素。然后,它遍历所有元素,如果元素包含文本,则用一个新的`text`元素替换它。如果元素不包含文本,则删除它。最后,它返回文档的文本内容,其中所有的HTML标签都被删除了。
阅读全文