itextpdf的jsoup 获取div的class
时间: 2024-04-30 22:05:26 浏览: 8
如果你想使用iTextPDF和jsoup来获取<div>标签的class属性,可以使用以下代码:
```
Document doc = Jsoup.connect("http://example.com/").get();
Elements divs = doc.select("div"); // 获取所有的div标签
for (Element div : divs) {
if (div.hasAttr("class")) { // 判断div标签是否有class属性
String className = div.attr("class"); // 获取div标签的class属性
Paragraph para = new Paragraph(className); // 创建一个段落对象
document.add(para); // 将段落添加到PDF文档中
}
}
```
这段代码会从一个网站上获取所有的div标签,并且分别获取它们的class属性。如果某个div标签有class属性,就会创建一个对应的段落对象,并将它添加到PDF文档中。你可以根据自己的需求修改代码来获取特定的div标签。需要注意的是,你需要在代码中定义一个iTextPDF的文档对象`document`,并在代码执行完毕后关闭它。
相关问题
jsoup获取div的class 段落
你可以使用以下代码来使用jsoup获取div标签的class属性和段落内容:
```
Document doc = Jsoup.connect("http://example.com/").get();
Elements divs = doc.select("div"); // 获取所有的div标签
for (Element div : divs) {
String className = div.className(); // 获取div标签的class属性
String paragraph = div.text(); // 获取div标签的文本内容
System.out.println("Class name: " + className);
System.out.println("Paragraph: " + paragraph);
}
```
这段代码会从一个网站上获取所有的div标签,并且分别获取它们的class属性和文本内容。你可以根据自己的需求修改代码来获取特定的div标签。
使用jsoup获取div标签中p标签的img标签
可以使用以下代码来获取div标签中p标签的img标签:
```java
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.select.Elements;
public class Main {
public static void main(String[] args) {
String html = "<div><p><img src='img1.jpg'></p><p><img src='img2.jpg'></p></div>";
Document doc = Jsoup.parse(html);
Elements imgs = doc.select("div > p > img");
for (int i = 0; i < imgs.size(); i++) {
System.out.println(imgs.get(i).attr("src"));
}
}
}
```
这里使用了Jsoup库来解析HTML文档,然后使用CSS选择器 "div > p > img" 来获取div标签中p标签的img标签。最后遍历获取到的img标签,并输出它们的src属性值。