Java读取pdf文件报错No valid entries or contents found, this is not a valid OOXML (Office Open XML) file
时间: 2023-11-22 09:49:44 浏览: 42
这个错误提示是因为Java试图将PDF文件解析为OOXML格式的文件,但是PDF文件不是OOXML格式的文件,因此会出现此错误。解决此问题的方法是使用适当的PDF解析库来读取PDF文件,例如Apache PDFBox或iText。以下是使用Apache PDFBox读取PDF文件的示例代码:
```java
import java.io.File;
import java.io.IOException;
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.text.PDFTextStripper;
public class ReadPDF {
public static void main(String[] args) {
try {
// 创建一个PDDocument对象来表示PDF文件
PDDocument document = PDDocument.load(new File("example.pdf"));
// 创建一个PDFTextStripper对象来提取文本
PDFTextStripper stripper = new PDFTextStripper();
// 获取文本内容
String text = stripper.getText(document);
// 输出文本内容
System.out.println(text);
// 关闭PDDocument对象
document.close();
} catch (IOException e) {
e.printStackTrace();
}
}
}
```