java 获取pdf关键字坐标

要获取 PDF 关键字的坐标，可以使用 Apache PDFBox 库。以下是获取 PDF 关键字坐标的示例代码： ```java import java.io.File; import java.io.IOException; import java.util.List; import org.apache.pdfbox.cos.COSArray; import org.apache.pdfbox.cos.COSBase; import org.apache.pdfbox.cos.COSDictionary; import org.apache.pdfbox.cos.COSName; import org.apache.pdfbox.pdmodel.PDDocument; import org.apache.pdfbox.pdmodel.PDPage; import org.apache.pdfbox.pdmodel.interactive.annotation.PDAnnotation; import org.apache.pdfbox.pdmodel.interactive.annotation.PDAnnotationTextMarkup; import org.apache.pdfbox.pdmodel.interactive.annotation.PDAnnotationTextMarkup.MarkupTypeEnum; import org.apache.pdfbox.pdmodel.interactive.annotation.PDAnnotationTextMarkup.QuadPoints; public class PDFKeywordCoordinates { public static void main(String[] args) throws IOException { String filePath = "example.pdf"; String keyword = "example"; PDDocument document = PDDocument.load(new File(filePath)); List<PDPage> pages = document.getDocumentCatalog().getAllPages(); for (PDPage page : pages) { List<PDAnnotation> annotations = page.getAnnotations(); for (PDAnnotation annotation : annotations) { if (annotation instanceof PDAnnotationTextMarkup) { PDAnnotationTextMarkup markup = (PDAnnotationTextMarkup) annotation; if (markup.getMarkupType() == MarkupTypeEnum.HIGHLIGHT) { COSDictionary dict = markup.getCOSObject(); COSArray quadPointsArray = (COSArray) dict.getDictionaryObject(COSName.getPDFName("QuadPoints")); for (int i = 0; i < quadPointsArray.size(); i += 8) { float x1 = quadPointsArray.getFloat(i); float y1 = quadPointsArray.getFloat(i + 1); float x2 = quadPointsArray.getFloat(i + 2); float y2 = quadPointsArray.getFloat(i + 3); float x3 = quadPointsArray.getFloat(i + 4); float y3 = quadPointsArray.getFloat(i + 5); float x4 = quadPointsArray.getFloat(i + 6); float y4 = quadPointsArray.getFloat(i + 7); if (containsKeyword(page, keyword, x1, y1, x2, y2, x3, y3, x4, y4)) { System.out.println("Keyword '" + keyword + "' found on page " + (pages.indexOf(page) + 1) + " at (" + x1 + "," + y1 + ") (" + x2 + "," + y2 + ") (" + x3 + "," + y3 + ") (" + x4 + "," + y4 + ")"); } } } } } } document.close(); } private static boolean containsKeyword(PDPage page, String keyword, float x1, float y1, float x2, float y2, float x3, float y3, float x4, float y4) throws IOException { StringBuilder sb = new StringBuilder(); sb.append("q\n"); sb.append(x1).append(' ').append(y1).append(" m\n"); sb.append(x2).append(' ').append(y2).append(" l\n"); sb.append(x3).append(' ').append(y3).append(" l\n"); sb.append(x4).append(' ').append(y4).append(" l\n"); sb.append("h\n"); sb.append("W* n\n"); sb.append("BT\n"); sb.append("/Helv 12 Tf\n"); sb.append("0 g\n"); sb.append("1 0 0 1 ").append(x1).append(' ').append(y1).append(" Tm\n"); sb.append("(").append(keyword).append(") Tj\n"); sb.append("ET\n"); sb.append("Q\n"); return page.getContents().stream().anyMatch(content -> content.getString().contains(sb.toString())); } } ``` 在此示例代码中，我们首先加载 PDF 文件并获取所有页面。然后，我们遍历每个页面的所有注释，并查找类型为“高亮”的注释。对于每个高亮注释，我们获取该注释的四个顶点坐标，并检查关键字是否包含在其中。如果找到匹配项，则打印关键字的坐标。

阅读全文

java 获取pdf关键字坐标

相关推荐

itext5实现PDF关键字与坐标智能盖章教程

使用Aspose.Pdf for Java在PDF中基于坐标添加内容指南

在PDF中使用Java和iText按坐标添加文本方法

java实现查找PDF关键字所在页码及其坐标

java 读取PDF内容 获取指定内容坐标

java读PDF文件内容并获取指定文字'签字'坐标

获取pdf文件中指定文字的坐标 附源码

第二章标识符、关键字和数据类型.pdf

Java读取PDF查找指定文字位置，并添加悬浮图片（文档签字/盖章）

东软春招java方向.pdf

FlappyBird_Java代码.pdf

JAVA 面试题集 pdf

JAVA期末考.pdf

java实现在pdf模板的指定位置插入图片

JAVA面试资料汇总.pdf

JAVA程序设计课程.pdf

java实验答案全.pdf

Java高频面试题.pdf

JAVA常用英语单词.pdf

java类的讲解.pdf

大家在看

Compax 3 调试步骤.pdf

Code-Generation-ARM-Compiler-V5.05update

Morpho3.2操作手册

seadas海洋遥感软件使用说明

Fundamentals of Wireless Communication-David Tse -课后习题答案

最新推荐

java实现在pdf模板的指定位置插入图片

java使用itext导出PDF文本绝对定位(实现方法)

java实现计算地理坐标之间的距离

java 根据经纬度获取地址实现代码

python点击鼠标获取坐标（Graphics）

易语言例程：用易核心支持库打造功能丰富的IE浏览框

管理建模和仿真的文件

STM32F407ZG引脚功能深度剖析：掌握引脚分布与配置的秘密（全面解读）

给出文档中问题的答案代码

Docker构建与运行Next.js应用的指南

java 读取PDF内容获取指定内容坐标

获取pdf文件中指定文字的坐标附源码