java读PDF表格中的文字,查询到指定文字‘签名’后,向右边的表格内插入本地图片,写详细demo

时间: 2023-05-22 15:07:01 浏览: 165
非常感谢您的提问。以下是一个基于Apache PDFBox的Java代码示例,它可以读取PDF表格中的文字,并在找到指定文字“签名”时,在其右侧插入本地图片。 在本示例中,我们将使用一个名为"test.pdf"的PDF文件。我们将尝试在该文件的第一个页面中查找名为“签名”的单元格,并在单元格的右侧插入本地图像"image.png"。 以下是完整的示例代码: // 导入PDFBox库 import org.apache.pdfbox.pdmodel.PDDocument; import org.apache.pdfbox.pdmodel.PDPage; import org.apache.pdfbox.pdmodel.PDPageContentStream; import org.apache.pdfbox.pdmodel.font.PDType1Font; import org.apache.pdfbox.pdmodel.table.PDPageContentStreamTableCell; import org.apache.pdfbox.pdmodel.table.PDTable; import org.apache.pdfbox.pdmodel.table.PDTableElement; import org.apache.pdfbox.pdmodel.table.PDTableElementCell; import org.apache.pdfbox.pdmodel.table.PDTableElementRow; import org.apache.pdfbox.pdmodel.table.PDTableFactory; import org.apache.pdfbox.pdmodel.table.PDTableStyle; import org.apache.pdfbox.pdmodel.table.PDTextCell; import org.apache.pdfbox.pdmodel.table.PDTextElement; import org.apache.pdfbox.pdmodel.table.PDTextRow; import org.apache.pdfbox.rendering.PDFRenderer; import org.apache.pdfbox.util.Matrix; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; public class PDFTableImageInsertDemo { public static void main(String[] args) { String pdfFilePath = "test.pdf"; String findText = "签名"; String imageFilePath = "image.png"; try { // 加载PDF文件 PDDocument document = PDDocument.load(new File(pdfFilePath)); PDPage page = document.getPage(0); // 获得页面的宽和高 float pageWidth = page.getMediaBox().getWidth(); float pageHeight = page.getMediaBox().getHeight(); // 获得页面中的表格 PDTable table = PDTableFactory.createTable(getTableContent(page), new PDTableStyle()); // 搜索指定的单元格 PDTableElementRow foundRow = null; PDTableElementCell foundCell = null; boolean found = false; for (int rowIndex = 0; rowIndex < table.getHeaderRowCount(); rowIndex++) { PDTableElementRow row = table.getHeaderRow(rowIndex); for (int cellIndex = 0; cellIndex < row.getCellCount(); cellIndex++) { PDTableElementCell cell = row.getCell(cellIndex); if (cell.containsText() && cell.getText().equals(findText)) { foundRow = row; foundCell = cell; found = true; break; } } if (found) break; } if (found) { // 在发现的单元格右边插入图像 int rowNum = foundRow.getRowIndex(); int cellNum = foundCell.getColumnIndex(); PDTableElementRow imageRow = table.getRow(rowNum); PDTableElementCell imageCell = new PDPageContentStreamTableCell(); imageCell.setColSpan(1); imageCell.setRowSpan(1); float cellWidth = foundCell.getColSpan() * foundCell.getWidth(); float cellLeft = foundCell.getTopLeftX(); float cellTop = imageRow.getTop() - imageRow.getHeight() - 5; // 插入图像 BufferedImage image = ImageIO.read(new File(imageFilePath)); PDPageContentStream contentStream = new PDPageContentStream(document, page, PDPageContentStream.AppendMode.PREPEND, false); contentStream.drawImage( image, cellLeft + cellWidth, cellTop, image.getWidth() / 2, image.getHeight() / 2 ); contentStream.close(); // 输出修改后的表格 try (PDPageContentStream contents = new PDPageContentStream(document, page, PDPageContentStream.AppendMode.APPEND, true, true)) { Matrix matrix = new Matrix(); matrix.translate(0, pageHeight); matrix.scale(1, -1); contents.transform(matrix); table.draw(contents, 0, 0, pageWidth - 50, pageHeight - 50, true); } } else { System.out.println("无法找到指定的单元格: " + findText); } // 保存修改后的PDF文档 document.save("output.pdf"); document.close(); System.out.println("已成功在指定单元格插入图像。"); } catch (IOException ex) { System.err.println("出现错误: " + ex.getMessage()); } } // 从表格获取数据 private static PDTableElement getTableContent(PDPage page) throws IOException { PDTableElement tableElement = new PDTextRow(); PDFRenderer renderer = new PDFRenderer(page); BufferedImage image = renderer.renderImageWithDPI(72, ImageType.RGB); int imageWidth = image.getWidth(); int imageHeight = image.getHeight(); PDType1Font font = PDType1Font.HELVETICA; int fontSize = 12; int tableTop = 0; int tableLeft = 0; int tableWidth = 0; for (int y = 0; y < imageHeight; y++) { StringBuilder rowText = null; int rowLeft = -1, cellIndex = 0; for (int x = 0; x < imageWidth; x++) { int color = image.getRGB(x, y); int red = (color >> 16) & 0xff; if (red > 200) { if (rowText == null) { rowText = new StringBuilder(); rowLeft = x; } rowText.append((char) color); } else if (rowText != null) { // 新单元格开始 String cellContent = rowText.toString().trim(); PDTextElement cellElement = new PDTextCell(); cellElement.setFont(font); cellElement.setFontSize(fontSize); cellElement.setLineSpacing(1.0f); cellElement.setIndent(5.0f); cellElement.setText(cellContent); PDTableElementCell cell = new PDPageContentStreamTableCell(); cell.setColSpan(1); cell.setRowSpan(1); cell.setElement(cellElement); PDTableElementRow row = tableElement.getLast() != null ? (PDTableElementRow) tableElement.getLast() : null; if (row == null || row.getTop() != tableTop) { row = new PDTextRow(); ((PDTextRow) row).setIndent(0); tableElement.addElement(row); tableTop = row.getTop(); tableLeft = rowLeft; tableWidth = 0; } assert row != null; if (x - rowLeft < tableWidth || cellIndex >= row.getCellCount()) { row.addElement(cell); } else { for (int i = row.getCellCount() - 1; i >= cellIndex; i--) { row.removeElement(i); } row.addElement(cell, cellIndex); } cellIndex++; rowText = null; } } if (rowText != null) { // 新行开始 String rowContent = rowText.toString().trim(); PDTextElement rowElement = new PDTextRow(); rowElement.setFont(font); rowElement.setFontSize(fontSize); rowElement.setLineSpacing(1.0f); rowElement.setIndent(5.0f); rowElement.setText(rowContent); PDTableElementRow row = new PDTextRow(); ((PDTextRow) row).setIndent(0); row.addElement(new PDPageContentStreamTableCell(), cellIndex); row.addElement(new PDPageContentStreamTableCell(), cellIndex + 1); row.setElement(rowElement); tableElement.addElement(row); } } return tableElement; } } 希望这个代码示例对您有所帮助。如果您有任何疑问,请随时告诉我。
阅读全文

相关推荐

最新推荐

recommend-type

Java 在PDF中添加骑缝章示例解析

在本文中,我们将通过示例代码详细介绍如何在 Java 中添加骑缝章,并使用 Free Spire.PDF for Java 工具来辅助加盖骑缝章。 首先,我们需要了解什么是骑缝章。骑缝章是一种印章加盖方法,用于往来业务合同,以确保...
recommend-type

BootStrap实现带有增删改查功能的表格(DEMO详解)

在本文中,我们将探讨如何使用BootStrap实现一个具有增删改查功能的表格。BootStrap是一个流行的前端开发框架,它提供了一套简洁且响应式的组件,使得网页设计和开发变得更加高效。在表格的实现上,BootStrap默认的...
recommend-type

java实现图片滑动验证(包含前端代码)

在本文中,我们将详细介绍 Java 实现图片滑动验证的过程,包括前端代码和后端代码。我们将使用 Java 语言来实现图片裁剪和生成,并使用 Spring Boot 框架来构建后端 API。 一、后端图片裁剪与生成 在后端,我们...
recommend-type

java使用es查询的示例代码

Java 使用 ES 查询的示例代码 Java 是当前最流行的编程语言之一,而 Elasticsearch(简称 ES)是当前流行的企业级搜索引擎。本篇文章主要介绍了 Java 使用 ES 查询的示例代码,旨在帮助开发者快速上手使用 ES。 ...
recommend-type

JAVA图形界面(GUI)之表格的示例代码

下面是JAVA图形界面(GUI)之表格的示例代码的详细解释: 一、JTable的构造方法 JTable是JAVA图形界面中的一种表格组件,用于显示大量数据。JTable的构造方法有多种,分别是: * JTable():构造一个默认的JTable...
recommend-type

PureMVC AS3在Flash中的实践与演示:HelloFlash案例分析

资源摘要信息:"puremvc-as3-demo-flash-helloflash:PureMVC AS3 Flash演示" PureMVC是一个开源的、轻量级的、独立于框架的用于MVC(模型-视图-控制器)架构模式的实现。它适用于各种应用程序,并且在多语言环境中得到广泛支持,包括ActionScript、C#、Java等。在这个演示中,使用了ActionScript 3语言进行Flash开发,展示了如何在Flash应用程序中运用PureMVC框架。 演示项目名为“HelloFlash”,它通过一个简单的动画来展示PureMVC框架的工作方式。演示中有一个小蓝框在灰色房间内移动,并且可以通过多种方式与之互动。这些互动包括小蓝框碰到墙壁改变方向、通过拖拽改变颜色和大小,以及使用鼠标滚轮进行缩放等。 在技术上,“HelloFlash”演示通过一个Flash电影的单帧启动应用程序。启动时,会发送通知触发一个启动命令,然后通过命令来初始化模型和视图。这里的视图组件和中介器都是动态创建的,并且每个都有一个唯一的实例名称。组件会与他们的中介器进行通信,而中介器则与代理进行通信。代理用于保存模型数据,并且中介器之间通过发送通知来通信。 PureMVC框架的核心概念包括: - 视图组件:负责显示应用程序的界面部分。 - 中介器:负责与视图组件通信,并处理组件之间的交互。 - 代理:负责封装数据或业务逻辑。 - 控制器:负责管理命令的分派。 在“HelloFlash”中,我们可以看到这些概念的具体实现。例如,小蓝框的颜色变化,是由代理来处理的模型数据;而小蓝框的移动和缩放则是由中介器与组件之间的通信实现的。所有这些操作都是在PureMVC框架的规则和指导原则下完成的。 在Flash开发中,ActionScript 3是主要的编程语言,它是一种面向对象的语言,并且支持复杂的事件处理和数据管理。Flash平台本身提供了一套丰富的API和框架,使得开发者可以创建动态的、交互性强的网络应用。 最后,我们还看到了一个压缩包文件的名称列表“puremvc-as3-demo-flash-helloflash-master”,这表明该演示项目的源代码应该可以在该压缩包中找到,并且可以在支持ActionScript 3的开发环境中进行分析和学习。开发者可以通过这个项目的源代码来深入了解PureMVC框架在Flash应用中的应用,并且学习到如何实现复杂的用户交互、数据处理和事件通信。
recommend-type

管理建模和仿真的文件

管理Boualem Benatallah引用此版本:布阿利姆·贝纳塔拉。管理建模和仿真。约瑟夫-傅立叶大学-格勒诺布尔第一大学,1996年。法语。NNT:电话:00345357HAL ID:电话:00345357https://theses.hal.science/tel-003453572008年12月9日提交HAL是一个多学科的开放存取档案馆,用于存放和传播科学研究论文,无论它们是否被公开。论文可以来自法国或国外的教学和研究机构,也可以来自公共或私人研究中心。L’archive ouverte pluridisciplinaire
recommend-type

YRC1000 EtherNet_IP通信协议:掌握连接与数据交换的6个关键策略

![YRC1000 EtherNetIP通信功能说明书](https://5.imimg.com/data5/SELLER/Default/2022/12/EE/XV/JL/4130645/yrc1000-csra-cdc101aa-3--1000x1000.jpg) # 摘要 YRC1000 EtherNet/IP通信协议作为工业自动化领域的重要技术之一,本论文对其进行了系统性的介绍和分析。从通信连接策略的实施到数据交换机制的详细阐述,再到高级应用与实践案例的深入探讨,本文全面覆盖了YRC1000的操作原理、配置方法、安全性和性能监控等方面。通过对各种典型应用场景的案例分析,本文不仅总结了
recommend-type

如何设置 OpenFileDialog 用户只能在固定文件夹及其子文件夹里选择文件

在Windows应用程序中,如果你想要限制OpenFileDialog让用户只能在特定的文件夹及其子文件夹中选择文件,你可以通过设置`InitialDirectory`属性和`Filter`属性来实现。以下是步骤: 1. 创建一个`OpenFileDialog`实例: ```csharp OpenFileDialog openFileDialog = new OpenFileDialog(); ``` 2. 设置初始目录(`InitialDirectory`)为你要限制用户选择的起始文件夹,例如: ```csharp string restrictedFolder = "C:\\YourR
recommend-type

掌握Makefile多目标编译与清理操作

资源摘要信息:"makefile学习用测试文件.rar" 知识点: 1. Makefile的基本概念: Makefile是一个自动化编译的工具,它可以根据文件的依赖关系进行判断,只编译发生变化的文件,从而提高编译效率。Makefile文件中定义了一系列的规则,规则描述了文件之间的依赖关系,并指定了如何通过命令来更新或生成目标文件。 2. Makefile的多个目标: 在Makefile中,可以定义多个目标,每个目标可以依赖于其他的文件或目标。当执行make命令时,默认情况下会构建Makefile中的第一个目标。如果你想构建其他的特定目标,可以在make命令后指定目标的名称。 3. Makefile的单个目标编译和删除: 在Makefile中,单个目标的编译通常涉及依赖文件的检查以及编译命令的执行。删除操作则通常用clean规则来定义,它不依赖于任何文件,但执行时会删除所有编译生成的目标文件和中间文件,通常不包含源代码文件。 4. Makefile中的伪目标: 伪目标并不是一个文件名,它只是一个标签,用来标识一个命令序列,通常用于执行一些全局性的操作,比如清理编译生成的文件。在Makefile中使用特殊的伪目标“.PHONY”来声明。 5. Makefile的依赖关系和规则: 依赖关系说明了一个文件是如何通过其他文件生成的,规则则是对依赖关系的处理逻辑。一个规则通常包含一个目标、它的依赖以及用来更新目标的命令。当依赖的时间戳比目标的新时,相应的命令会被执行。 6. Linux环境下的Makefile使用: Makefile的使用在Linux环境下非常普遍,因为Linux是一个类Unix系统,而make工具起源于Unix系统。在Linux环境中,通过终端使用make命令来执行Makefile中定义的规则。Linux中的make命令有多种参数来控制执行过程。 7. Makefile中变量和模式规则的使用: 在Makefile中可以定义变量来存储一些经常使用的字符串,比如编译器的路径、编译选项等。模式规则则是一种简化多个相似规则的方法,它使用模式来匹配多个目标,适用于文件名有规律的情况。 8. Makefile的学习资源: 学习Makefile可以通过阅读相关的书籍、在线教程、官方文档等资源,推荐的书籍有《Managing Projects with GNU Make》。对于初学者来说,实际编写和修改Makefile是掌握Makefile的最好方式。 9. Makefile的调试和优化: 当Makefile较为复杂时,可能出现预料之外的行为,此时需要调试Makefile。可以使用make的“-n”选项来预览命令的执行而不实际运行它们,或者使用“-d”选项来输出调试信息。优化Makefile可以减少不必要的编译,提高编译效率,例如使用命令的输出作为条件判断。 10. Makefile的学习用测试文件: 对于学习Makefile而言,实际操作是非常重要的。通过提供一个测试文件,可以更好地理解Makefile中目标的编译和删除操作。通过编写相应的Makefile,并运行make命令,可以观察目标是如何根据依赖被编译和在需要时如何被删除的。 通过以上的知识点,你可以了解到Makefile的基本用法和一些高级技巧。在Linux环境下,利用Makefile可以有效地管理项目的编译过程,提高开发效率。对于初学者来说,通过实际编写Makefile并结合测试文件进行练习,将有助于快速掌握Makefile的使用。