IElementNode node = (IElementNode) element; 获取节点的html
时间: 2024-03-03 12:53:24 浏览: 134
要获取 `IElementNode` 对象的 HTML 内容,你可以使用 `node.outerHtml()` 方法。这个方法将返回整个节点的 HTML 代码,包括其内部的所有子节点。如果你只想要节点内部的文本内容,你可以使用 `node.innerHtml()` 方法,这个方法将返回节点内部的所有文本内容,但不包括节点本身的 HTML 标签。下面是一个简单的示例代码:
```java
import com.itextpdf.html2pdf.ConverterProperties;
import com.itextpdf.html2pdf.HtmlConverter;
import com.itextpdf.kernel.pdf.PdfDocument;
import com.itextpdf.kernel.pdf.PdfWriter;
import com.itextpdf.layout.element.IElement;
import com.itextpdf.layout.element.IElementNode;
import java.io.File;
import java.io.IOException;
import java.util.List;
public class HtmlToPdfExample {
public static void main(String[] args) throws IOException {
String html = "<html><body><em>斜体文本</em></body></html>";
PdfWriter pdfWriter = new PdfWriter(new File("output.pdf"));
PdfDocument pdfDocument = new PdfDocument(pdfWriter);
ConverterProperties converterProperties = new ConverterProperties();
List<IElement> elements = HtmlConverter.convertToElements(html, converterProperties);
for (IElement element : elements) {
if (element instanceof IElementNode) {
IElementNode node = (IElementNode) element;
if ("em".equalsIgnoreCase(node.name())) {
String nodeHtml = node.outerHtml();
System.out.println("Node HTML: " + nodeHtml);
String nodeInnerText = node.innerHtml();
System.out.println("Node Inner Text: " + nodeInnerText);
}
}
pdfDocument.add(element);
}
pdfDocument.close();
}
}
```
在这个示例代码中,我们遍历 HTML 中的每个元素,如果遇到了一个 `em` 标签,就将其转换为一个 `IElementNode` 对象。然后我们使用 `node.outerHtml()` 和 `node.innerHtml()` 方法分别获取节点的 HTML 内容和内部文本内容,并将其打印到控制台上。
阅读全文