首页Jsoup解析html留下标签

Jsoup解析html留下标签

时间: 2023-07-04 19:19:28 浏览: 108

Jsoup解析HTML实例及文档方法详解

主要介绍了Jsoup如何解析一个HTML文档、从文件加载文档、从URL加载Document等方法，对Jsoup常用方法做了详细讲解，最近提供了一个示例供大家参考使用DOM方法来遍历一个文档从元素抽取属性，文本和HTML获取所有链接

你可以使用Jsoup的.text()方法来获取文本内容，该方法会自动去除HTML标签。如果你想要保留某些标签，可以使用Jsoup的.whitelist()方法来指定允许的标签，例如： ```java String html = "<div><p>Hello, <b>world!</b></p></div>"; String whitelist = "<div><b>"; String text = Jsoup.clean(html, whitelist); System.out.println(text); // 输出：<div>Hello, <b>world!</b></div> ``` 在上面的例子中，我们指定只允许保留`<div>`和`<b>`标签，并且使用Jsoup的clean()方法进行过滤，保留了这两个标签，输出的结果为包含这两个标签的HTML内容。

阅读全文