umi-ocr接口调用转双层pdf
时间: 2025-01-03 21:35:12 浏览: 12
### 使用 Umi-OCR API 创建双层 PDF
为了创建一个既包含原始图像又包含可选文本的双层PDF文件,Umi-OCR接口提供了特定参数来实现这一目标。当调用API时,需指定输出格式为`pdfWithTextLayer`以指示服务器返回带有所识别文本图层的PDF文档[^1]。
下面是一个Python代码片段展示如何配置请求并发送至umi-ocr服务端:
```python
import requests
from pathlib import Path
url = "https://api.umi-ocr.com/v1/convert"
headers = {
'Authorization': 'Bearer YOUR_ACCESS_TOKEN',
}
data = {
'output_format': 'pdfWithTextLayer', # 设置输出格式为双层PDF
'margin': '10mm', # 可选:设置页面边距
'password': '' # 可选:设置打开密码(如果不需要则留空)
}
files = {'file': open('example.pdf', 'rb')}
response = requests.post(url, headers=headers, data=data, files=files)
if response.status_code == 200:
with open(Path.cwd() / 'output_with_text_layer.pdf', 'wb') as f:
f.write(response.content)
else:
print(f"Error: {response.text}")
```
此段程序会向Umi-OCR的服务提交一份待处理文件,并指明期望获得的是具有文本层的PDF版本。成功执行后将会下载生成的新文件到本地磁盘上[^2]。
阅读全文