pdfReader = new PdfReader(filepath); PdfReaderContentParser pdfReaderContentParser = new PdfReaderContentParser(pdfReader); renderListener.setKeyWord("签名"); renderListener.setPage(1); pdfReaderContentParser.processContent(page, renderListener); float[] coordinate = renderListener.getPcoordinate();去除PDF文字空格
时间: 2023-05-23 12:04:25 浏览: 110
可以通过使用Java的字符串处理函数trim()来去除PDF文字空格,如下所示:
String text = content.trim();
其中content是提取出来的PDF文字内容,trim()函数将去除字符串开头和结尾的空格。
相关问题
pdfReader = new PdfReader(filepath); PdfReaderContentParser pdfReaderContentParser = new PdfReaderContentParser(pdfReader); renderListener.setKeyWord("签名"); renderListener.setPage(1); pdfReaderContentParser.processContent(page, renderListener); float[] coordinate = renderListener.getPcoordinate();最后是null
A:可能是因为你并没有在页面上找到包含关键词“签名”的内容,所以getPcoordinate()返回了null。建议在调用getPcoordinate()之前检查一下是否成功找到了关键词,可以打印一下renderListener中收集到的内容来确认。
pdfReader = new PdfReader(filepath);获取PDF文字
内容时,为什么会出现乱码?
A:可能是因为读取的PDF文件编码格式与代码中使用的编码格式不匹配导致的。可以尝试使用指定的编码格式来读取PDF文件内容,例如:
```
PdfReader pdfReader = new PdfReader(filepath);
String content = pdfReader.getPageContent(1).toString("UTF-8");
```
其中,"UTF-8"为指定的编码格式,可以根据需要修改。如果还是出现乱码,可以尝试使用其他编码格式来读取。
阅读全文