Jsoup解析html留下标签
时间: 2023-07-04 22:19:28 浏览: 64
你可以使用Jsoup的.text()方法来获取文本内容,该方法会自动去除HTML标签。如果你想要保留某些标签,可以使用Jsoup的.whitelist()方法来指定允许的标签,例如:
```java
String html = "<div><p>Hello, <b>world!</b></p></div>";
String whitelist = "<div><b>";
String text = Jsoup.clean(html, whitelist);
System.out.println(text); // 输出:<div>Hello, <b>world!</b></div>
```
在上面的例子中,我们指定只允许保留`<div>`和`<b>`标签,并且使用Jsoup的clean()方法进行过滤,保留了这两个标签,输出的结果为包含这两个标签的HTML内容。
相关问题
Jsoup解析HTML标签
很高兴回答你的问题。Jsoup是一个Java库,用于解析HTML标签并提取其中的数据。它可以通过CSS选择器查找和操作HTML元素,还提供了很多有用的功能,例如清理HTML、字符转义和文本提取。希望这个回答对你有所帮助。
jsoup解析html
JSoup是Java语言的一个HTML解析器,它可以方便地从HTML文档中提取数据。
使用JSoup解析HTML的基本步骤如下:
1. 导入JSoup的jar包。
2. 创建一个Document对象,该对象表示整个HTML文档。
```java
Document doc = Jsoup.connect("http://example.com/").get();
```
3. 从Document对象中获取元素。
```java
Element content = doc.getElementById("content");
```
4. 从元素中获取数据。
```java
String text = content.text();
```
JSoup还提供了许多其他的方法来获取和操作HTML元素,例如根据标签名、类名、属性等进行选择,以及修改HTML元素的属性和内容等。