java将html富文本带图片转为.docx、 .pdf、 .image的工具类

可以使用Apache POI和iText库来实现将带有图片的富文本转换为.docx和.pdf文件。 1. 将富文本转换为.docx文件使用Apache POI库可以将富文本转换为.docx文件，具体代码如下： ```java import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.io.OutputStream; import org.apache.poi.xwpf.usermodel.XWPFDocument; import org.apache.poi.xwpf.usermodel.XWPFParagraph; import org.apache.poi.xwpf.usermodel.XWPFRun; public class HtmlToDocxConverter { public static void convert(String htmlFilePath, String docxFilePath) throws IOException { XWPFDocument doc = new XWPFDocument(); XWPFParagraph paragraph = doc.createParagraph(); XWPFRun run = paragraph.createRun(); InputStream in = new FileInputStream(htmlFilePath); run.setText(org.apache.commons.io.IOUtils.toString(in, "UTF-8")); OutputStream out = new FileOutputStream(docxFilePath); doc.write(out); out.close(); doc.close(); } } ``` 2. 将富文本转换为.pdf文件使用iText库可以将富文本转换为.pdf文件，具体代码如下： ```java import java.io.File; import java.io.FileOutputStream; import java.io.IOException; import com.itextpdf.kernel.pdf.PdfDocument; import com.itextpdf.kernel.pdf.PdfWriter; import com.itextpdf.layout.Document; import com.itextpdf.layout.element.Paragraph; import org.jsoup.Jsoup; import org.jsoup.nodes.Document.OutputSettings; import org.jsoup.nodes.Element; import org.jsoup.select.Elements; public class HtmlToPdfConverter { public static void convert(String htmlFilePath, String pdfFilePath) throws IOException { PdfWriter writer = new PdfWriter(new FileOutputStream(pdfFilePath)); PdfDocument pdf = new PdfDocument(writer); Document document = new Document(pdf); org.jsoup.nodes.Document htmlDoc = Jsoup.parse(new File(htmlFilePath), "UTF-8"); OutputSettings settings = new OutputSettings(); settings.prettyPrint(false); for (Element element : htmlDoc.body().children()) { if ("img".equals(element.tagName())) { byte[] imageBytes = getImageBytes(element.attr("src")); if (imageBytes != null) { com.itextpdf.layout.element.Image image = new com.itextpdf.layout.element.Image( com.itextpdf.io.image.ImageDataFactory.create(imageBytes)); document.add(image); } } else { Elements pElements = element.getElementsByTag("p"); for (Element pElement : pElements) { Paragraph p = new Paragraph(pElement.html()); document.add(p); } } } document.close(); } private static byte[] getImageBytes(String imageUrl) { // 将图片url转换为字节数组 } } ``` 3. 将富文本转换为图片将富文本转换为图片可以使用第三方工具，如wkhtmltoimage或phantomjs。这里以wkhtmltoimage为例，具体代码如下： ```java import java.io.File; import java.io.IOException; import java.util.ArrayList; import java.util.List; public class HtmlToImageConverter { public static void convert(String htmlFilePath, String imageFilePath) throws IOException { List<String> cmd = new ArrayList<>(); cmd.add("wkhtmltoimage"); cmd.add("--quality"); cmd.add("100"); cmd.add(htmlFilePath); cmd.add(imageFilePath); ProcessBuilder pb = new ProcessBuilder(cmd); pb.redirectErrorStream(true); Process process = pb.start(); try { process.waitFor(); } catch (InterruptedException e) { e.printStackTrace(); } } } ```

阅读全文

java将html富文本带图片转为.docx、 .pdf、 .image的工具类

相关推荐

java html转pdf工具类

html转pdf工具类

java后端实现html转pdf的工具类,pd4ml

如何使用免费PDF控件从PDF文档中提取文本和图片.docx

java项目案例分析pdf (2).docx

Java 给11PDF签名时添加时间戳.docx

《Java 基础之正则表达式：强大的文本匹配利器》.docx

JavaScript+Java实现HTML页面转为PDF文件保存的方法-.docx

java处理JSON格式数据的通用类.docx

DocxToPdf:无需 Office 即可将 .docx 转换为 .pdf 的 C# 库

劳动合同示范文本(网络).docx

java新手超级入门——类结构篇.docx

Java-11Date 类的学习总结.docx

基于java的java学习平台设计与实现.docx

pdfMaker:一个简单的核心Java项目，可将.docx文件转换为.pdf文件

Java技11术：Java基础知识.docx

基于java的垃圾分类系统设计与实现.docx

基于java的垃圾分类网站设计与实现.docx

基于java的新闻类网站设计与实现.docx

java项目案例分析pdf.docx

大家在看

TwinSAFE EL6900 安全模块基础使用指南（针对TC3.1.4020.0版本）.pdf

南京工业大学Python程序设计语言题库及答案

泊松分布MATLAB代码-RJNS3D_VER_1.1:离散断裂网络建模

Skill.wz_冒险岛079WZ_079skill.wz_冒险岛的_冒险岛Skill.wz_冒险岛服务端_

Multisim里的NPN三极管参数资料大全.docx

最新推荐

java代码保存宽高不变压缩图片(失真不大).docx

word转html带目录结构的实现方式.docx

真正解决百度编辑器UEditor上传图片跨域问题.docx

pdf.js在java web项目中远程预览ftp上的pdf文件.docx

Java实现将word转换为html的方法示例【doc与docx格式】

世界地图Shapefile文件解析与测试指南

Python环境监控高可用构建：可靠性增强的策略

需要在matlab当中批量导入表格数据的指令

Sqlcipher 3.4.0版本发布，优化SQLite兼容性

Python环境监控性能监控与调优：专家级技巧全集