word解析The supplied data appears to be in the OLE2 Format. You are calling
时间: 2023-12-14 10:34:34 浏览: 246
Inside OLE2
4星 · 用户满意度95%
这个错误通常是因为你正在尝试使用Apache POI解析doc格式的Word文档,而不是docx格式的Word文档。doc格式的Word文档使用的是OLE2格式,而不是OOXML格式,因此你需要使用Apache POI的HSSF库来处理这种类型的文档。以下是一个使用HSSF库解析doc格式Word文档的示例代码:
```java
FileInputStream fis = new FileInputStream("example.doc");
POIFSFileSystem fs = new POIFSFileSystem(fis);
HWPFDocument doc = new HWPFDocument(fs);
WordExtractor extractor = new WordExtractor(doc);
String text = extractor.getText();
System.out.println(text);
```
这段代码使用了Apache POI的HWPF库来解析doc格式的Word文档。它首先创建一个FileInputStream对象来读取文件,然后使用POIFSFileSystem对象将文件系统中的数据读入内存。接下来,它创建一个HWPFDocument对象来表示Word文档,并使用WordExtractor对象从文档中提取文本。最后,它将提取的文本打印到控制台上。
阅读全文