Word
转
html
带目录结构的实现方式
Word 转 html 带目录结构的实现方式
1 概述
将 word 中的目录结构树提取出来放到 html 的左侧并生成相应的树目录,在
html 中点击树目录时整个页面可以跳到对应的位置。经研究要实现该需求可以分为两
步:
1.将 word 转为 html
2.提取 word 中目录结构树并生成 html 中的树目录。
2 将 word 转为 html
网上有很多将 word 转为 html 的方案,这里不作详细说明,大致分为使用 word
自带的转 html 的 api(也就是使用 jacob)和 POI 进行转换。简单的对比了一下使用
jacob 转换的 html 的效果比 POI 好,使用 POI 时有一些特殊的表格、公式等不能正常
显示。具体使用 jacob 将 word 转为 html 的步骤如下:
2.1 MAVEN 配置
<dependency>
<groupId>jacob</groupId>
<artifactId>jacob</artifactId>
<version>1.19</version>
</dependency>
2.2 具体 java 代码实现
public static int DOC_SAVE_TYPE_HTML = 10;
public static int DOC_SAVE_TYPE_DOCX = 12;
/**
* doc 转为 docx
* @param docPath
* @param docxPath
广州扩普科技发展有限公司 第 1 页 共 5 页 Copyright@Guangzhou
Kuopu 2019
评论0