java读取pdf内容
时间: 2023-07-01 09:05:56 浏览: 30
要读取 PDF 内容,通常需要使用第三方库。比较常用的有 Apache PDFBox、iText 等。
以下是使用 Apache PDFBox 的示例代码:
```java
import java.io.IOException;
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.text.PDFTextStripper;
public class PDFReader {
public static void main(String[] args) {
try {
PDDocument document = PDDocument.load(new File("example.pdf"));
PDFTextStripper stripper = new PDFTextStripper();
String content = stripper.getText(document);
System.out.println(content);
document.close();
} catch (IOException e) {
e.printStackTrace();
}
}
}
```
上述代码加载了名为 "example.pdf" 的 PDF 文件,并使用 `PDFTextStripper` 来提取其中的文本。最后将提取到的内容打印输出。