使用jsoup只抓取p标签和img标签
时间: 2024-03-16 10:44:00 浏览: 131
你可以使用以下代码来使用jsoup抓取p标签和img标签:
```java
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class JsoupExample {
public static void main(String[] args) throws Exception {
String html = "<html><body><p>Paragraph 1</p><img src=\"image.jpg\"/><p>Paragraph 2</p></body></html>";
Document doc = Jsoup.parse(html);
Elements paragraphs = doc.select("p");
for (Element p : paragraphs) {
System.out.println(p.text());
}
Elements images = doc.select("img");
for (Element img : images) {
System.out.println(img.attr("src"));
}
}
}
```
在这个例子中,我们首先使用Jsoup将HTML字符串解析为Document对象。然后,我们使用select方法来选择所有的p标签和img标签。对于每个p标签,我们输出其文本内容;对于每个img标签,我们输出其src属性的值。
阅读全文